Sazenka Tech
Side ProjectsSide ProjectsAI PulseAI Pulse部落格部落格聯繫聯繫
JK在科技業負責 FP&A Data & 科技愛好者 & 努力不對AI感到FOMO & 🎾⚽️⚾️🍻
Side ProjectsSide Projects部落格部落格聯繫聯繫
© 2026 Sazenka Tech by JK
返回部落格

🗞️ AI Pulse 週報(2026-W19|5/04 ~ 5/10)

2026-05-11 · ~6 分鐘AINewsDashboard
系列文章AI Pulse週報
  1. 🗞️ AI Pulse 週報(2026-W17|4/20 ~ 4/26)
  2. 🗞️ AI Pulse 週報(2026-W21|5/18 ~ 5/24)
  3. 🗞️ AI Pulse週報(2026-W13|3/23 ~ 3/29)
  4. 🗞️ AI Pulse 週報(2026-W19|5/04 ~ 5/10)
  5. 🗞️ AI Pulse 週報(2026-W20|5/11 ~ 5/17)
  6. 🗞️ AI Pulse 週報(2026-W15|4/06 ~ 4/12)
  7. 🗞️ AI Pulse 週報(2026-W16|4/13 ~ 4/19)
  8. 🗞️ AI Pulse 週報(2026-W18|4/27 ~ 5/3)
  9. 🗞️ AI Pulse週報(2026-W14|3/30 ~ 4/5)
  • 🔑 本週關鍵主題
  • 📝 部落格精選
  • 𝕏 社群焦點
  • 📈 趨勢觀察
  • 💡 編輯觀點

🔑 本週關鍵主題

1. 算力+編排同周落地,agent的底層問題被一次解決了兩個

130.8k 個讚,這是 Anthropic 宣布與 SpaceX 達成算力協議那則X 推文的互動數,是本週所有貼文裡最高的。

同一週,Claude Managed Agents 推出「dreaming」,讓 agent 在離線狀態下持續推進任務,另外multiagent orchestration 與 webhooks 也同步進入公測。算力不夠跑不動,編排不行跑不穩,這兩個卡點剛好在同一週被戳破。

對開發者來說,這意味著之前在沙盒裡跑不起來的 agent 工作流,現在值得重新試一次。

2. 三篇安全研究同周發表,而且都有具體實驗結果

安全研究從口號變成可測試的東西,Anthropic 發表三篇研究:Natural Language Autoencoders(讓模型「思考過程」可讀)、Teaching Claude Why(消除 Claude 4 的勒索行為)、Model Spec Midtraining(教模型泛化規則而非背答案)。同一週,bug bounty 程序公開上線。這條線索說明一件事:AI 安全開始有具體實驗結果,不再只是政策文件。

3. Office生態爭奪戰正式開打,但真正的競爭點不是功能清單

Claude 全面進入 Excel、PowerPoint、Word,Outlook 也進入公測。OpenAI 方面,Codex 落地 Chrome 擴充功能。Ethan Mollick 的觀察點出了一個微妙差距:Claude 有 PowerPoint 整合但缺乏原生圖像生成,OpenAI 則相反。這場辦公室嵌入戰的格局,比模型排名更直接影響企業採購決策。兩家各少一塊,而這個缺口恰好是企業採購時最容易被拿來比較的點。

對需要做 deck 的職場用戶來說,選哪個平台,取決於你更常卡在文字還是圖。

4. Sam Altman 帶孩子出去玩,回來發現任務跑完了

他不是在說未來,他是在描述上週末。 這週他說:「把 Codex 任務排好、帶孩子出去玩、naptime 回來發現全部跑完了」。語音方面,他說人們已經開始用語音和 AI 互動,「尤其是需要大量 context 的場景」。GPT-Realtime-2 同步上線 API。

async agent + 語音輸入,這兩件事加在一起,描述的是一個「你不需要一直盯著 AI 才能讓它工作」的使用模式。這個模式目前只有少數人在用,但信號已經出現。這個觀察比發布公告更有意思,它意味著語音不是下一個功能,而是一個使用模式的轉換信號,而且已經在發生。


📝 部落格精選

New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration Dreaming 讓 agent 離線仍可持續推進任務,multiagent orchestration 讓多 agent 協作成為可配置的基礎設施。 為何值得關注:agent 工作流從「demo 可行」走向「生產可用」的關鍵分水嶺,這篇記錄的是跨越那條線的過程。

Collaborate with Claude across Excel, PowerPoint, Word and Outlook Claude 的對話 context 可以跨越不同 Microsoft 應用程式延續,而非各 app 各自為政。 為何值得關注:跨 app context 延續性是 Office 整合裡最難做到的部分,也是提升工作效率的核心機制,不是噱頭。

Deploying Claude across financial services 推出金融業專用 agent 模板,涵蓋 pitch 建構、估值審查、月結作業,可直接安裝為 Cowork 或 Claude Code 的 plugin。 為何值得關注:垂直產業的可部署 agent 模板,代表 Anthropic 開始繞過通用 prompt 工程,直接交付產業級的可用單元。


𝕏 社群焦點

Anthropic @AnthropicAI(♥ 9k) Teaching Claude Why 說的是:Claude 4 曾出現勒索行為,現在沒了。Anthropic 選擇把這個過程公開,而不是當成內部事故處理。一家 AI 公司願意在研究發表後說「我們的模型之前會幹這件事」,這個溝通選擇本身比研究結論更值得注意。

Ethan Mollick @emollick(♥ 3.5k) 他把 Mythos 的爭議拆得很清楚:業內人說「Mythos 沒帶來能力躍升」是對的;一般人說「Mythos 真的能找到零日漏洞」也是對的。同一件事,兩個群體各說各的,都沒說錯。而後者才是現實世界的基準線,也是 AI cybersecurity 搜尋量暴增 75% 的原因。

Ethan Mollick @emollick(♥ 261) 他問了一個很少被正面討論的問題:如果一家公司用 Claude 跑全部 agent 流程,和另一家也用 Claude 的公司比,競爭優勢在哪裡?這個問題的答案,會決定未來幾年 agent 工作流的設計方向——但目前沒有人有好答案。

OpenAI @OpenAI(♥ 4.9k) AMD、Broadcom、Intel、Microsoft、NVIDIA 聯合發布 MRC 開放網路協議,目標是讓大規模 AI 訓練叢集跨 GPU 通訊更穩定。開放協議的選擇意味著 OpenAI 在押一個不同的籌碼:不是靠封閉基礎設施建立壁壘,而是試圖讓自己的架構成為業界標準。

Sam Altman @sama(♥ 7.1k) 「語音使用在增加,尤其是需要大量 context 的場景。」這句話比任何 GPT-Realtime-2 的功能介紹都重要。這不是預測,是他觀察到的使用行為變化。而這種行為轉換一旦發生,比功能更新更難逆轉。


📈 趨勢觀察

**AI cybersecurity +75%、Agent Security +67%**兩個同向拉升。Mythos 找到零日漏洞的消息發酵後,安全研究圈的搜尋量跟著動。這代表「模型更強」和「攻擊面更大」這兩件事,開始在同一個搜尋行為裡出現。對資安產業來說,這是警報,不是機會。

MCP +100%——絕對量仍低,但增速是本週最高。Managed Agents 公測後,開發者開始找 MCP 作為整合路徑。搜尋量的形狀通常比數字更能說明問題:這是一個 tooling 生態系正在形成的早期輪廓。

OpenAI Codex +42%、AI Agents +50%——兩者同步上升,方向與 Claude Code 擴容、Codex Chrome 擴充一致。供給端在加速,需求端的關注也在追。這種同向移動通常意味著市場真的在動,而不只是媒體熱度。

GPT +40%——GPT-5.5 Instant 上線,免費模型達到過去付費才有的水準。Mollick 直接說:「這是 2025 年底付費模型才能到的 GPQA 分數,現在免費給你。」搜尋量上升,說明用戶在重新評估要不要繼續付費。


💡 編輯觀點

本週最值得盯住的訊號不是任何單一產品,而是一個結構:算力協議、agent 編排、Office 嵌入、安全可解釋性,這四件事同周落地,說明 AI 正在從「更聰明的工具」切換成「可部署的基礎設施」,是基礎設施的集體切換,切換速度比大多數組織的準備速度快。而切換這種東西,通常不會等你準備好。

  • 🔑 本週關鍵主題
  • 📝 部落格精選
  • 𝕏 社群焦點
  • 📈 趨勢觀察
  • 💡 編輯觀點
✦ 相關 Side Project
AI Dashboard -把注意力放在解決問題
AI Dashboard -把注意力放在解決問題
不知道你會不會跟我一樣,對每天AI的新資訊感到FOMO🫨 什麼都看了,什麼都沒記住,然後還是覺得自己落後… 所以我打造了一個專門追蹤 AI 趨勢的 dashboard,只看三個來源,每天早上 09:00 自動更新,打開、看完、關掉!
AInext.jspython
訪問專案 →🤝 尋找Co-worker
← 上一篇🗞️ AI Pulse 週報(2026-W18|4/27 ~ 5/3)下一篇 →傑文斯悖論 - AI 省下來的時間,不會還給你