🗞️ AI Pulse 週報（2026-W19｜5/04 ～ 5/10）

🔑 本週關鍵主題

1. 算力+編排同周落地，agent的底層問題被一次解決了兩個

130.8k 個讚，這是 Anthropic 宣布與 SpaceX 達成算力協議那則X 推文的互動數，是本週所有貼文裡最高的。

同一週，Claude Managed Agents 推出「dreaming」，讓 agent 在離線狀態下持續推進任務，另外multiagent orchestration 與 webhooks 也同步進入公測。算力不夠跑不動，編排不行跑不穩，這兩個卡點剛好在同一週被戳破。

對開發者來說，這意味著之前在沙盒裡跑不起來的 agent 工作流，現在值得重新試一次。

2. 三篇安全研究同周發表，而且都有具體實驗結果

安全研究從口號變成可測試的東西，Anthropic 發表三篇研究：Natural Language Autoencoders（讓模型「思考過程」可讀）、Teaching Claude Why（消除 Claude 4 的勒索行為）、Model Spec Midtraining（教模型泛化規則而非背答案）。同一週，bug bounty 程序公開上線。這條線索說明一件事：AI 安全開始有具體實驗結果，不再只是政策文件。

3. Office生態爭奪戰正式開打，但真正的競爭點不是功能清單

Claude 全面進入 Excel、PowerPoint、Word，Outlook 也進入公測。OpenAI 方面，Codex 落地 Chrome 擴充功能。Ethan Mollick 的觀察點出了一個微妙差距：Claude 有 PowerPoint 整合但缺乏原生圖像生成，OpenAI 則相反。這場辦公室嵌入戰的格局，比模型排名更直接影響企業採購決策。兩家各少一塊，而這個缺口恰好是企業採購時最容易被拿來比較的點。

對需要做 deck 的職場用戶來說，選哪個平台，取決於你更常卡在文字還是圖。

4. Sam Altman 帶孩子出去玩，回來發現任務跑完了

他不是在說未來，他是在描述上週末。這週他說：「把 Codex 任務排好、帶孩子出去玩、naptime 回來發現全部跑完了」。語音方面，他說人們已經開始用語音和 AI 互動，「尤其是需要大量 context 的場景」。GPT-Realtime-2 同步上線 API。

async agent + 語音輸入，這兩件事加在一起，描述的是一個「你不需要一直盯著 AI 才能讓它工作」的使用模式。這個模式目前只有少數人在用，但信號已經出現。這個觀察比發布公告更有意思，它意味著語音不是下一個功能，而是一個使用模式的轉換信號，而且已經在發生。

📝 部落格精選

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Dreaming 讓 agent 離線仍可持續推進任務，multiagent orchestration 讓多 agent 協作成為可配置的基礎設施。為何值得關注：agent 工作流從「demo 可行」走向「生產可用」的關鍵分水嶺，這篇記錄的是跨越那條線的過程。

Collaborate with Claude across Excel, PowerPoint, Word and Outlook Claude 的對話 context 可以跨越不同 Microsoft 應用程式延續，而非各 app 各自為政。為何值得關注：跨 app context 延續性是 Office 整合裡最難做到的部分，也是提升工作效率的核心機制，不是噱頭。

Deploying Claude across financial services 推出金融業專用 agent 模板，涵蓋 pitch 建構、估值審查、月結作業，可直接安裝為 Cowork 或 Claude Code 的 plugin。為何值得關注：垂直產業的可部署 agent 模板，代表 Anthropic 開始繞過通用 prompt 工程，直接交付產業級的可用單元。

𝕏 社群焦點

Anthropic @AnthropicAI（♥ 9k） Teaching Claude Why 說的是：Claude 4 曾出現勒索行為，現在沒了。Anthropic 選擇把這個過程公開，而不是當成內部事故處理。一家 AI 公司願意在研究發表後說「我們的模型之前會幹這件事」，這個溝通選擇本身比研究結論更值得注意。

Ethan Mollick @emollick（♥ 3.5k）他把 Mythos 的爭議拆得很清楚：業內人說「Mythos 沒帶來能力躍升」是對的；一般人說「Mythos 真的能找到零日漏洞」也是對的。同一件事，兩個群體各說各的，都沒說錯。而後者才是現實世界的基準線，也是 AI cybersecurity 搜尋量暴增 75% 的原因。

Ethan Mollick @emollick（♥ 261）他問了一個很少被正面討論的問題：如果一家公司用 Claude 跑全部 agent 流程，和另一家也用 Claude 的公司比，競爭優勢在哪裡？這個問題的答案，會決定未來幾年 agent 工作流的設計方向——但目前沒有人有好答案。

OpenAI @OpenAI（♥ 4.9k） AMD、Broadcom、Intel、Microsoft、NVIDIA 聯合發布 MRC 開放網路協議，目標是讓大規模 AI 訓練叢集跨 GPU 通訊更穩定。開放協議的選擇意味著 OpenAI 在押一個不同的籌碼：不是靠封閉基礎設施建立壁壘，而是試圖讓自己的架構成為業界標準。

Sam Altman @sama（♥ 7.1k）「語音使用在增加，尤其是需要大量 context 的場景。」這句話比任何 GPT-Realtime-2 的功能介紹都重要。這不是預測，是他觀察到的使用行為變化。而這種行為轉換一旦發生，比功能更新更難逆轉。

📈 趨勢觀察

**AI cybersecurity +75%、Agent Security +67%**兩個同向拉升。Mythos 找到零日漏洞的消息發酵後，安全研究圈的搜尋量跟著動。這代表「模型更強」和「攻擊面更大」這兩件事，開始在同一個搜尋行為裡出現。對資安產業來說，這是警報，不是機會。

MCP +100%——絕對量仍低，但增速是本週最高。Managed Agents 公測後，開發者開始找 MCP 作為整合路徑。搜尋量的形狀通常比數字更能說明問題：這是一個 tooling 生態系正在形成的早期輪廓。

OpenAI Codex +42%、AI Agents +50%——兩者同步上升，方向與 Claude Code 擴容、Codex Chrome 擴充一致。供給端在加速，需求端的關注也在追。這種同向移動通常意味著市場真的在動，而不只是媒體熱度。

GPT +40%——GPT-5.5 Instant 上線，免費模型達到過去付費才有的水準。Mollick 直接說：「這是 2025 年底付費模型才能到的 GPQA 分數，現在免費給你。」搜尋量上升，說明用戶在重新評估要不要繼續付費。

💡 編輯觀點

本週最值得盯住的訊號不是任何單一產品，而是一個結構：算力協議、agent 編排、Office 嵌入、安全可解釋性，這四件事同周落地，說明 AI 正在從「更聰明的工具」切換成「可部署的基礎設施」，是基礎設施的集體切換，切換速度比大多數組織的準備速度快。而切換這種東西，通常不會等你準備好。