🗞️ AI Pulse 週報（2026-W15｜4/06 ～ 4/12）

🔑 本週關鍵主題

1. Agent 基礎設施的規模化競賽

三天，三個產品。Managed Agents、Advisor Strategy、Cowork 企業版——Anthropic 不是在發新功能，是在告訴市場：agent 的戰場已經移動了。

能不能用，早就不是問題。問題是能不能撐住一千個用戶同時跑、能不能從原型活著走到生產環境。這才是本週那三個發布在解決的事。

對開發者來說，這意味著你現在面對的不只是「怎麼寫 prompt」，而是「怎麼設計一個可以交給 agent 跑的系統」。兩件事的距離，比想像中遠。

2. Claude Mythos 與 AI 資安的紅色警戒

Anthropic 發布了一個他們自己都不敢完全公開的模型。

Project Glasswing 的核心是 Claude Mythos Preview，漏洞挖掘能力超越絕大多數頂尖人類安全研究員。Ethan Mollick 的估算是：CISO 辦公室剩下六到九個月，之後這類能力會擴散到你不希望它出現的地方。

對企業來說，這不是「以後的問題」。現在不看 Mythos 紅隊報告，等於六個月後才開始備戰。

3. AI 編程工具的能力感知落差

Karpathy 這週寫了一篇很長的文章，核心只有一句話：兩群人在說兩種完全不同的 AI。

用免費舊模型形成印象的人，跟付費用最新 Codex、Claude Code 的工程師，他們看到的根本不是同一個東西。前者在笑 AI 的幻覺，後者在看 AI 花一小時重構整個 codebase。

這個落差不會自己消失。它會繼續讓「AI 到底有多強」這個問題，永遠沒有共識。

📝 部落格精選

Multi-agent coordination patterns 系統性整理五種多 agent 協作架構及適用場景。對正在評估 agent 架構的工程團隊來說，這是比行銷文章更實用的參考文件。

Claude Managed Agents Anthropic 推出託管式 agent 執行環境，主打「原型到生產壓縮至數天」。背後要解決的是長時間執行、基礎設施管理這類讓企業卻步的摩擦點。

The advisor strategy 用 Opus 擔任顧問、Sonnet 或 Haiku 執行任務，以接近旗艦模型的品質換取顯著降低的成本。這是一個兼顧能力與經濟性的架構設計。

Preparing your security program for AI-accelerated offense 寫給防守方的指南，但字裡行間透露的是進攻方已擁有 Mythos 這樣的工具。這篇文章的存在本身就是一種警告。

How Carta Healthcare gets AI to reason like a clinical abstractor 醫療 AI 落地的具體案例，描述如何讓模型的推理方式貼近臨床資料萃取的專業邏輯。

𝕏 社群焦點

Karpathy｜你看到的 AI，不是他們看到的 AI 他的長文不是在說「AI 很厲害」。他在說的是：為什麼同樣面對 AI，兩群人的結論差這麼遠。答案是：使用的模型層級不同，解決的問題類型不同，看到的能力天花板就完全不一樣。這個框架，比任何 benchmark 都更接近真實。（♥ 19.5k）

Ethan Mollick｜Mythos 是第一個，不是最後一個 他的觀察精準在兩點：Mythos 不是為資安設計的，只是夠強所以擅長資安；這是第一個觸發安全疑慮的模型，後面還有。「第一個」三個字，才是真正值得害怕的地方。（♥ 534）

Ethan Mollick｜2025 年的數據，告訴不了你 2027 年的事 研究顯示 GenAI 在 2025 年對大型企業幾乎沒有衝擊。他的警告是：缺乏 agent 工具、採用需要時間，這些條件現在都在改變。用昨天的研究預測明天，是方法論錯誤，不是謹慎。（♥ 267）

Anthropic｜與 Google、Broadcom 簽下多 GW TPU 容量 2027 年起生效。這個數字的量級不是在準備下一個模型，是在準備未來三到五年的訓練與推論基礎。算力的佈局，永遠比模型發布早幾年發生。（♥ 20.9k）

Ethan Mollick｜產品發布速度，已經超過市場能吸收的速度 本週 Anthropic 的密集節奏讓他說出這句話：有意義的新產品上線速度，可能已經快過企業客戶能夠評估與採購的速度。這不是好事，也不是壞事。是一個結構性的問題，沒有人有答案。（♥ 335）

📈 趨勢觀察

Claude AI（分數 100，週增 +15）：Mythos 曝光加上 Managed Agents 公測，兩件事同週發生，搜尋量創近期高點。數字背後是技術社群真實的注意力移動，不只是品牌聲量。
AI 資安（隱性上升）：Google Trends 沒有追蹤這個詞，但 Mythos 的社群討論熱度說明：這個議題正在從研究圈滲透進 CISO 的決策清單。六到九個月是 Mollick 給的窗口，不是隱喻。
Codex／Claude Code（高原期）：OpenAI 推出 $100 Pro 訂閱層，直接因應 Codex 使用量爆增。AI 編程工具從「實驗」進入「付費驗證」，這個轉變比模型能力的提升更值得記錄。

💡 編輯觀點

本週 Anthropic 同時在做兩件看似無關的事：把 agent 基礎設施推向規模化，把一個危險模型交給防守方先看。這兩條線交會的地方，是同一個問題的兩面——AI 能做到的邊界在擴張，能帶來的風險也在同步擴張。接下來六到九個月，就是看誰先到那條線。