🗞️ AI Pulse 週報（2026-W20｜5/11 ～ 5/17）

🔑 本週關鍵主題

1. Anthropic和OpenAI的編碼Agent卡位戰

同一週，Anthropic 和 OpenAI 各自出了三張牌。 Claude Code 推出 Agent View、上架 AWS；OpenAI 把 Codex 搬進行動 App，還給企業開了兩個月免費試用期。功能差距已不是重點——真正的競爭在於誰先把工具嵌進企業的採購流程和開發習慣裡。

對開發者來說，這意味著下一季的選擇不只是哪個模型比較聰明，而是哪個生態系統綁定成本更低、退出成本更高。卡位戰正在悄悄進行。

2. 網路安全能力的突破

AI 的網路攻防能力，每 4.5 個月翻倍一次。

英國 AISI 的獨立評估揭示了一個讓人不太舒服的數字：模型在網路安全領域的能力倍增週期約為 4.5 個月。Mythos Preview 是首個端對端破解「Cooling Tower」靶場的模型，GPT-5.5 緊隨其後。

更值得注意的是，兩個模型的能力上限似乎不受智力限制，而是受限於 token 數量——這表示「砸更多算力」就能直接換來更高危險等級的攻擊能力。防禦方的更新速度，能跟上這條曲線嗎？

3. 企業落地加速

Anthropic 這週做的事，比過去三個月加起來還多。

法律產業專屬版 Claude、Gates Foundation 兩億美元合作、美中 AI 競爭白皮書——三件事同週發生，不像巧合，更像是刻意排程的企業信號彈。

垂直行業加地緣政治，是 Anthropic 試圖在「模型本身」之外建立壁壘的方式。對金融、法律等高合規場景的從業者而言，這些訊號值得追蹤——因為它們往往比功能發布更早預示採購方向。

📝 部落格精選

Agent view in Claude Code 統一管理所有 Claude Code session 的新介面，以 research preview 形式上線。多 Agent 並行管理從此有了視覺化入口，代表 Anthropic 認真把 Claude Code 當成長期主力產品在打磨。

Claude for the legal industry 針對法律產業推出專屬版本，同時附上部署指南。繼金融、醫療之後，AI 落地法律業正式成為 Anthropic 的企業策略軸線。

How Anthropic's cybersecurity team built a threat detection platform with Claude Code Anthropic 內部資安團隊用 Claude Code 自建威脅偵測平台的實戰紀錄。最好的廣告是自用，這篇等於公開背書 Claude Code 在高敏感場景的可信度。

Best practices for computer and browser use with Claude 整理電腦與瀏覽器操控 Agent 的實作最佳實踐。操作手冊的出現代表 Anthropic 在推動 computer use 進入 production 環境，不再只是 demo。

Introducing the Claude Platform on AWS Claude API 完整功能現可透過 AWS 驗證、計費與 commitment 直接使用。對企業採購而言，AWS 通道大幅降低合規摩擦，是打進大型企業的關鍵一步。

𝕏 社群焦點

Andrej Karpathy・♥ 17.4k

AI 的輸入輸出介面正在進化：純文字 → Markdown → HTML，最終方向是神經網路直接生成的互動影像。他認為人類大腦三分之一用於視覺處理，AI 輸出理應往這個方向走。

你現在就可以試的方法：請 LLM 把回應輸出成 HTML，在瀏覽器裡打開。比 Markdown 直覺，比純文字好消化。一個低成本的工作流升級，值得試試。

Ethan Mollick・♥ 546（引用 METR / 英國 AISA 評估）

Mollick 引用兩份獨立評估: METR 與英國 AISA ，已確認 AI 能力曲線進入指數加速段。他用 waitbutwhy 的「you are here」梗點出：AI 能力曲線已進入指數加速段，不是「快到了」，是「已過了」。

Ethan Mollick・♥ 589（論 Codex 介面設計偏見）

Codex 很強，但介面預設用戶是工程師。Mollick 點出一個 AI 產業的慣性盲點：把「非開發者」等同於「需要把複雜度藏起來的人」，而不是「需要不同形式複雜度的人」。

這不只是 UX 問題。如果下一個主力工具只對工程師友善，普通工作者的生產力紅利就會晚到。對做產品的人來說，這是一個明顯的市場缺口。

Boris Cherny（Anthropic）・♥ 3.0k

Claude Cowork 搭配 Opus 4.7，首次一次到位完成機票預訂，沒有中途出錯。

這不是 demo，是 Anthropic 內部人員在日常使用中的直接驗證。Agent 從「能用」到「可以信賴」，這條線正在被跨過。

📈 趨勢觀察

MCP・Vibe Coding｜+100% 雙雙翻倍，前者反映開發者生態整合需求，後者說明「不寫 code 也能開發」已從話題變成實際搜索行為——有人在找教學、找工具，不只是在聊天。

Agent Security｜+33% 與 GPT 搜索量同步上升，不是巧合。模型能力越強，安全焦慮越快跟進。Mythos 的網路安全突破，同時推高了防禦方的緊張程度。

Claude Mythos・Prompt Injection｜+25% 兩者同步上升，說明新能力和新攻擊面在使用者認知裡是綁定的。越強的模型，越多人想知道它能被怎麼騙。

claude cowork｜+50% 小基數但成長顯著。Cowork 對一般用戶的滲透正在發生，不只停留在開發者圈子裡。

AI in Finance｜−50% 注意力明顯轉向 coding 工具。金融 AI 話題本週相對冷場——不是退燒，是短期被 coding 戰局搶走了版面。

💡 編輯觀點

本週最值得盯的不是任何一個新功能，而是獨立評估機構的措辭從「接近臨界點」變成了「已過臨界點」。當 METR 和英國 AISA 開始這樣說，下一批重新校準的，會是監管機構、企業採購預算，還有那些還在觀望的人。