🗞️ AI Pulse 週報（2026-W21｜5/18 ～ 5/24）

🔑 本週關鍵主題

1. Karpathy 加入 Anthropic

Karpathy 宣布加入 Anthropic 的那則貼文，沒有解釋薪酬、沒有炫耀估值，只說了一句：「接下來幾年最關鍵的研究方向」。

這種措辭方式本身就是一個立場。一個在 OpenAI 待過、自己做過教育平台的人，最後用「這幾年最關鍵」來解釋他的選擇。他在押注的不是公司規模，是研究方向。

當頂尖研究者開始用腳投票，產業格局不只是在重組，是在讓你看見他們真正相信什麼。

2. AI 解決 80 年數學懸案

OpenAI 模型解開了 Erdős 在 1946 年提出的平面單位距離問題。數學界相信了 80 年的最優解，被一個通用模型推翻了。

然後 Ethan Mollick 做了一件更重要的事——他把時間軸攤開：

2024 年 6 月，模型數不清草莓裡有幾個 r。
2025 年 7 月，拿下國際數學奧林匹亞金牌。
2026 年 5 月，解決幾何學未解難題。

這不是 AI 能力的線性成長，是跳躍。而且每一跳，都在你「開始習慣上一跳」的時候發生。

Mollick 接著問了一個沒人敢正面回答的問題：數學有可驗證的答案，所以 AI 在這裡很容易炫技。但有哪個實驗室願意把同等資源投進社會科學——社會學、經濟學、心理學？那些學科的突破，對人類的影響可能比解一道幾何題大得多。目前沒有人舉手。

3. Enterprise AI 全面落地 Anthropic 這週發布的六篇文章，沒有一篇在談模型分數，全都是企業應用。

財務團隊用 Claude 把數字轉化成敘事，不只是產報表。資安夥伴用 Opus 掃出超過一萬個高危漏洞。合規與安全工具整合上線。銷售主管用 Cowork 管理 4,000 個客戶帳號。

這個組合在說一件事：Claude 的定位已經不是「聊天機器人」，是「企業作業系統的一層」。當你的 ERP、你的 CRM、你的資安流程都開始接 Claude，換供應商的成本就不只是重新簽約，是重新部署整個工作流。

這是護城河，不是功能更新。

4. 算力即將成為新的貧富分水嶺

Mollick 這週提出了本週最不舒服的觀察：

算力短缺正在形成雙速世界。最大的公司跑複雜的 agentic 工作流，其他人只能停在單輪 chatbot。OpenAI 同步推出 Guaranteed Capacity 長期合約，讓你用一到三年的承諾換取穩定的運算資源。

這不是在說「AI 很貴」，這是在說「能用多少 AI，正在變成一種競爭優勢的結構性差距」。

他沒有給解法。他只是把這個問題擺在那裡，讓你自己去想這對你的公司、你的職涯意味著什麼。

本週部落格精選

Finance 的敘事工程 Anthropic 財務團隊用 Claude 把數字轉化為敘事。 → FP&A 的核心工作正在從「整理數字」位移到「詮釋數字」，這個變化比你想的來得快。

Project Glasswing 資安成果 夥伴用 Opus 掃出超過萬個高危漏洞，AI 資安從概念進入規模化部署。 → 值得追蹤的是後續修補速度是否跟得上發現速度。

Claude Managed Agents 更新 新增自架 Sandbox 與 MCP Tunnels，讓企業在自有安全邊界內跑 Agent。 → Anthropic 在補 MCP 生態的基礎設施，企業導入的最後一道阻力正在被拆除。

Claude Cowork 銷售應用 業務主管用 Cowork 管理 4,000 個帳號，展示 agentic 工作流在 CRM 的實際效益。 → Cowork 越來越像「給非工程師用的 Claude Code」，產品化路徑值得持續觀察。

HTML 的荒謬有效性 探討 Claude Code 在生成 HTML 時效果出奇好的原因，涉及語言特性與訓練資料結構。 → 直接解釋了「為什麼跑前端任務特別順」這個很多人有感但說不清楚的現象。

𝕏 社群焦點

Andrej Karpathy｜加入 Anthropic
用「接下來幾年在前沿特別關鍵」解釋選擇，一個字沒提薪酬或規模。這種措辭本身就是立場——他在押注研究方向，不是公司估值。
→ 本週全站最高互動，148.7k 讚。人才流向本身就是產業訊號。

Ethan Mollick｜AI 解題的成本換算
Erdős 問題的算力消耗：不到三顆杏仁的用水量、相當於開電動車 2–20 英里的電力。他沒有說「這很便宜」，只是把數字擺在那裡讓你自己換算。
→ 高互動，帶出能源成本與 AI 能力邊界的雙重討論。

Boris Cherny｜Claude Code auto mode
不再跳權限確認視窗、支援多 session 並行——他稱之為「目前使用 Claude Code 最重要的一個技巧」。開發者工作流正在從單執行緒走向並發。
→ 技術社群討論熱烈，對重度使用者的效率影響直接。

Ethan Mollick｜算力分層的政治經濟學
複雜 agentic 工作流將成為大企業的專利，中小企業被鎖在 chatbot 層。他沒有給解法，只是把這個問題擺在那裡。
→ 中等熱度，但對政策判斷與投資決策的影響力遠超互動數。

Ethan Mollick｜Gemini 把推理軌跡藏起來
Gemini 隱藏思考過程，無法驗證它是否真的做了搜尋。他的結論直接：「這讓 Gemini 不適合任何需要正確性的嚴肅工作。」透明度與可信度之間的張力，現在變成了產品選擇的依據。
→ 中等互動，但指出了一個多數評測沒有量化的核心問題。

趨勢數字裡藏的訊號

MCP 搜尋量週漲 100%，Vibe Coding 同樣翻倍——兩個都是從接近零起跳，時間點與 Managed Agents 發布高度重疊。開發者在問的問題正在從「怎麼用 AI」變成「怎麼把 AI 接進我的系統」。

Claude Mythos 漲幅 67%，沒有官方說明。搜尋量從幾乎沒有開始往上，通常代表某個名字正在從內部往外洩漏。不確定是功能代號還是新產品線，但值得標記起來。

Project Glasswing 在發布後迅速跌回 -50%。這個模式說明目前仍是「關注但觀望」，商業化還需要時間讓市場消化。

GPT 搜尋量週漲 43%，Codex 新功能加上數學突破雙重加持，OpenAI 這週的聲量是全場最高的。

本週最值得盯的不是哪個模型分數更高。

是兩條同時在跑的軌道：Anthropic 把 Claude 嵌入企業流程的速度，和算力稀缺正在把 AI 能力切割成不同等級的現實。

這兩件事加在一起的意思是：「能不能用 AI」已經不是問題，「能用多少 AI」才是。