🔑 本週關鍵主題
1. Karpathy 加入 Anthropic
Karpathy 宣布加入 Anthropic 的那則貼文,沒有解釋薪酬、沒有炫耀估值,只說了一句:「接下來幾年最關鍵的研究方向」。
這種措辭方式本身就是一個立場。一個在 OpenAI 待過、自己做過教育平台的人,最後用「這幾年最關鍵」來解釋他的選擇。他在押注的不是公司規模,是研究方向。
當頂尖研究者開始用腳投票,產業格局不只是在重組,是在讓你看見他們真正相信什麼。
2. AI 解決 80 年數學懸案
OpenAI 模型解開了 Erdős 在 1946 年提出的平面單位距離問題。數學界相信了 80 年的最優解,被一個通用模型推翻了。
然後 Ethan Mollick 做了一件更重要的事——他把時間軸攤開:
- 2024 年 6 月,模型數不清草莓裡有幾個 r。
- 2025 年 7 月,拿下國際數學奧林匹亞金牌。
- 2026 年 5 月,解決幾何學未解難題。
這不是 AI 能力的線性成長,是跳躍。而且每一跳,都在你「開始習慣上一跳」的時候發生。
Mollick 接著問了一個沒人敢正面回答的問題:數學有可驗證的答案,所以 AI 在這裡很容易炫技。但有哪個實驗室願意把同等資源投進社會科學——社會學、經濟學、心理學?那些學科的突破,對人類的影響可能比解一道幾何題大得多。目前沒有人舉手。
3. Enterprise AI 全面落地 Anthropic 這週發布的六篇文章,沒有一篇在談模型分數,全都是企業應用。
財務團隊用 Claude 把數字轉化成敘事,不只是產報表。資安夥伴用 Opus 掃出超過一萬個高危漏洞。合規與安全工具整合上線。銷售主管用 Cowork 管理 4,000 個客戶帳號。
這個組合在說一件事:Claude 的定位已經不是「聊天機器人」,是「企業作業系統的一層」。當你的 ERP、你的 CRM、你的資安流程都開始接 Claude,換供應商的成本就不只是重新簽約,是重新部署整個工作流。
這是護城河,不是功能更新。
4. 算力即將成為新的貧富分水嶺
Mollick 這週提出了本週最不舒服的觀察:
算力短缺正在形成雙速世界。最大的公司跑複雜的 agentic 工作流,其他人只能停在單輪 chatbot。OpenAI 同步推出 Guaranteed Capacity 長期合約,讓你用一到三年的承諾換取穩定的運算資源。
這不是在說「AI 很貴」,這是在說「能用多少 AI,正在變成一種競爭優勢的結構性差距」。
他沒有給解法。他只是把這個問題擺在那裡,讓你自己去想這對你的公司、你的職涯意味著什麼。
本週部落格精選
Finance 的敘事工程 Anthropic 財務團隊用 Claude 把數字轉化為敘事。 → FP&A 的核心工作正在從「整理數字」位移到「詮釋數字」,這個變化比你想的來得快。
Project Glasswing 資安成果 夥伴用 Opus 掃出超過萬個高危漏洞,AI 資安從概念進入規模化部署。 → 值得追蹤的是後續修補速度是否跟得上發現速度。
Claude Managed Agents 更新 新增自架 Sandbox 與 MCP Tunnels,讓企業在自有安全邊界內跑 Agent。 → Anthropic 在補 MCP 生態的基礎設施,企業導入的最後一道阻力正在被拆除。
Claude Cowork 銷售應用 業務主管用 Cowork 管理 4,000 個帳號,展示 agentic 工作流在 CRM 的實際效益。 → Cowork 越來越像「給非工程師用的 Claude Code」,產品化路徑值得持續觀察。
HTML 的荒謬有效性 探討 Claude Code 在生成 HTML 時效果出奇好的原因,涉及語言特性與訓練資料結構。 → 直接解釋了「為什麼跑前端任務特別順」這個很多人有感但說不清楚的現象。
𝕏 社群焦點
Andrej Karpathy|加入 Anthropic
用「接下來幾年在前沿特別關鍵」解釋選擇,一個字沒提薪酬或規模。這種措辭本身就是立場——他在押注研究方向,不是公司估值。
→ 本週全站最高互動,148.7k 讚。人才流向本身就是產業訊號。
Ethan Mollick|AI 解題的成本換算
Erdős 問題的算力消耗:不到三顆杏仁的用水量、相當於開電動車 2–20 英里的電力。他沒有說「這很便宜」,只是把數字擺在那裡讓你自己換算。
→ 高互動,帶出能源成本與 AI 能力邊界的雙重討論。
Boris Cherny|Claude Code auto mode
不再跳權限確認視窗、支援多 session 並行——他稱之為「目前使用 Claude Code 最重要的一個技巧」。開發者工作流正在從單執行緒走向並發。
→ 技術社群討論熱烈,對重度使用者的效率影響直接。
Ethan Mollick|算力分層的政治經濟學
複雜 agentic 工作流將成為大企業的專利,中小企業被鎖在 chatbot 層。他沒有給解法,只是把這個問題擺在那裡。
→ 中等熱度,但對政策判斷與投資決策的影響力遠超互動數。
Ethan Mollick|Gemini 把推理軌跡藏起來
Gemini 隱藏思考過程,無法驗證它是否真的做了搜尋。他的結論直接:「這讓 Gemini 不適合任何需要正確性的嚴肅工作。」透明度與可信度之間的張力,現在變成了產品選擇的依據。
→ 中等互動,但指出了一個多數評測沒有量化的核心問題。
趨勢數字裡藏的訊號
MCP 搜尋量週漲 100%,Vibe Coding 同樣翻倍——兩個都是從接近零起跳,時間點與 Managed Agents 發布高度重疊。開發者在問的問題正在從「怎麼用 AI」變成「怎麼把 AI 接進我的系統」。
Claude Mythos 漲幅 67%,沒有官方說明。搜尋量從幾乎沒有開始往上,通常代表某個名字正在從內部往外洩漏。不確定是功能代號還是新產品線,但值得標記起來。
Project Glasswing 在發布後迅速跌回 -50%。這個模式說明目前仍是「關注但觀望」,商業化還需要時間讓市場消化。
GPT 搜尋量週漲 43%,Codex 新功能加上數學突破雙重加持,OpenAI 這週的聲量是全場最高的。
本週最值得盯的不是哪個模型分數更高。
是兩條同時在跑的軌道:Anthropic 把 Claude 嵌入企業流程的速度,和算力稀缺正在把 AI 能力切割成不同等級的現實。
這兩件事加在一起的意思是:「能不能用 AI」已經不是問題,「能用多少 AI」才是。
