🔑 本週關鍵主題
1. 三家同週升級 Agent,這不是巧合
本週 Anthropic、OpenAI、Google 在同一個時間窗口各自推出 Agent 層功能:Claude Managed Agents 記憶體公測、OpenAI workspace agents、Google Gemini Enterprise Agent Platform。三家都在搶同一個問題的答案:Agent 怎麼在組織裡活過一個 session 以上。
對你的意義是:Agent 的戰場已經從「能不能做到」移到「能不能記住、能不能跨工具、能不能管理」。
2. GPT-5.5 出來了,但「誰最強」的問題已經沒有答案
OpenAI 推出 GPT-5.5,幾天內開放 API,Ethan Mollick 實測後說 Pro 版目前是硬問題的最強選擇。同一週,Mollick 也說沒必要每次新模型出來就換陣營——Opus 4.7 的 adaptive thinking 這週也更新了。
對你的意義是:模型評比進入「當日有效,明日作廢」的週期。與其追誰最強,不如先搞清楚你的工作流程到底需要什麼。
3. 影像生成跨過了某條線
ChatGPT Images 2.0 本週讓 Mollick 說出「我沒想到影像模型的品質門檻會讓我這麼吃驚」。它已經能處理文字排版、漫畫分頁、學術圖表——這些都是上一代做不到的事。更關鍵的發現:選哪個底層 LLM 會大幅影響輸出,影像生成和推理能力正在深度整合。
對你的意義是:「影像 AI」和「文字 AI」的分類正在消失。同一個模型,選不同思考模式,輸出完全不同。
4. AI 研究能力逼近人類中位數
一篇以 Claude Code 與 Codex 重跑經典「146 個經濟學家團隊同一資料集」實驗的論文顯示,AI 的答案落點接近人類中位數,但離散程度更低、沒有極端值。Mollick 另外指出,AI Agent 已能獨立重建複雜學術論文,而學術界尚未完全意識到這件事的影響。
對你的意義是:學術界還沒完全意識到這件事。當同儕審查的假設是「複製研究很難」,而 AI 讓它變得很容易——很多制度性壁壘會比預期早崩。
📝 部落格精選
Building agents that reach production systems with MCP 官方說明如何用 MCP 讓 Agent 安全觸及生產環境。MCP 本週搜尋量翻倍,這篇是配套的實作框架,正在評估 Agent 落地的工程師必讀。
Built-in memory for Claude Managed Agents Managed Agents 記憶體層公測,可跨 session 學習累積上下文。Agent 從「工具」變「夥伴」的缺口,Anthropic 開始補了。
New connectors in Claude for everyday life Claude 新增 Spotify、TurboTax、Tripadvisor 等消費者日常整合。Anthropic 過去以企業與開發者為重心,這波明顯在往 C 端移動。
Meet the winners of our Built with Opus 4.6 Claude Code hackathon Claude Code 黑客松獲獎作品展示。同週拿下 Webby Award,獲獎作品是觀察 Claude Code 真實使用極限最直接的窗口。
𝕏 社群焦點
Anthropic @AnthropicAI(♥ 14.9k) 宣布與 Amazon 擴大合作,目標 5 GW 算力,部分本季上線。在 GPT-5.5 發布的同一週主動談算力佈局——這個時間點選得很刻意。
Sam Altman @sama(♥ 9.3k) 呼籲重新設計 OS 與 UI,並制定一個「人類與 Agent 同等可用」的網路協議。這句話比 GPT-5.5 的發布公告更值得記——它說的是現有的網路架構根本不是為 Agent 設計的。
Ethan Mollick @emollick(♥ 1.4k) Agent 已能在沒有原始碼與論文的情況下獨立重建複雜研究,且錯誤往往出在人類論文而非 AI。同儕審查制度建立在「複製研究需要人力」這個假設上,這個假設正在失效。
Ethan Mollick @emollick(♥ 1.3k) 所有「靠費力才能維持稀缺性」的系統——推薦信、訴訟、政府文件、學術論文——在 AI 大幅壓低生產成本後將面臨結構性崩解。本週互動最低、份量最重的一條推文。
Boris Cherny @bcherny(♥ 3.4k) Claude Code 在獲得 Webby Award 的同一週,主動發布了品質問題的事後檢討報告。把聲譽管理和透明度放在同一週,這種操作方式本身就值得學。
📈 趨勢觀察
Edge AI +1650% — 基數低,可能是單一事件觸發,但若下週持續,代表邊緣端推論的討論正在從研究圈溢出到一般搜尋層。
MCP +100%、Vibe Coding +100% — 同步翻倍不是偶然。MCP 對應 Agent 基礎設施熱度上升;Vibe Coding 是「AI 輔助開發」這件事開始有自己的語彙,代表它在文化層面站穩了。
Agent Security +67%、Prompt Injection +50% — 能做的事愈多,被攻擊的面就愈大。安全搜尋量跟著 Agent 能力曲線走,這兩個關鍵字是滯後指標,現在上升意味著市場已經開始認真看待風險。
AI in Finance +50% — 相對小眾但持續爬升。Anthropic 本週剛好發布 Project Deal(讓 Claude 代為在辦公室市集中買賣談判),是金融應用具體落地的一個早期樣本。
Claude Mythos +38%、AI cybersecurity +38% — 前者反映模型命名的社群討論熱度;後者與資安賽道直接相關,值得持續追蹤。
💡 編輯觀點
本週最強的訊號不是 GPT-5.5,而是 Sam Altman 那句「應該有一個人類與 Agent 同等可用的網路協議」。可以看到三大廠同步在 Agent 記憶體與跨工具整合上的押注,顯示出基礎設施競賽已悄悄轉移到「Agent 能在組織裡活多久」這個問題上,模型競賽是表面,底層在重寫的是整個數位基礎設施的假設對象: 從人,變成人加 Agent。
