v2026.4.24 — Google Meet 加入 + DeepSeek V4 + Talk 即時語音

發布日期:2026 年 4 月 24 日
定位:頻道 / 模型 / 即時語音三線擴充
Breaking Changes:移除 api.registerEmbeddedExtensionFactory(...) Pi-only 相容路徑(插件改用 api.registerAgentToolResultMiddleware(...)


核心亮點

1. Google Meet 加入 OpenClaw

Google Meet 變成 bundled 參與者插件:

  • 個人 Google 認證
  • 明確 meeting URL 加入會議
  • Chrome 和 Twilio 即時音訊傳輸
  • 配對節點 chrome-node 支援(Parallels 風格的 Chrome/BlackHole/SoX 主機)
  • 直播語音裡可以 consult 完整 OpenClaw agent
  • 文物(artifact)和出席紀錄匯出工作流(會議記錄、錄音、轉錄、smart notes、參與者 sessions)
  • 已開啟 Meet tab 的恢復工具:recover_current_tabrecover-tab 不會打開重複 tab

2. DeepSeek V4 加入

DeepSeek V4 Flash 和 V4 Pro 進入 bundled catalog:

  • V4 Flash 是 onboarding 預設
  • 修復後續 tool-call 輪次的 thinking / replay 行為

3. Talk Mode 即時語音 + 完整代理 consult

Talk、Voice Call、Google Meet 可用即時語音迴圈,並 consult 完整 OpenClaw agent 取更深的工具背書答案:

  • 瀏覽器 WebRTC 即時語音 session 支援 OpenAI Realtime
  • Gateway 簽發短效 client secret
  • openclaw_agent_consult 把難題交給完整代理人

不再受限於即時語音模型本身的工具能力。

4. Voice Call 與 Gemini Live

  • 新增 Gemini Live 即時語音提供商(給 Voice Call、Google Meet 音訊橋)
  • 雙向音訊 + function-call 支援
  • 新增 voicecall setup 和 dry-run 預設的 voicecall smoke 指令,讓 Twilio / 提供商準備度可在打測試電話前先檢查

5. Browser 自動化升級

  • 視窗座標點擊(不再只能 a11y refs):openclaw browser click-coords
  • 動作預算預設拉到 60 秒(browser.actionTimeoutMs 可調)
  • per-profile browser.profiles.<name>.headless 覆寫(一個 profile 可以跑 headless 不必全部跑 headless)
  • tab 重用 / 恢復更穩定

6. Control UI Tool Access 重做

  • 緊湊的 live-tool 晶片
  • 可摺疊的工具群組
  • 直接 per-tool 切換
  • 更清楚的 runtime / source 來源
  • 聊天裡 queued 訊息加 Steer 動作,可以把 follow-up 注入到 active run 不必重新打字

7. 模型 / 插件啟動加速

  • bundled 提供商用安全的靜態 catalogs,啟動 models list 變快
  • 模型 catalog 走 manifest-sourced 的 row、duplicate 衝突回報、共用 src/model-catalog 標準化
  • node-llama-cpp 預設不再裝(local embeddings 在 operator 裝可選 runtime 套件後才載)
  • 大幅減少啟動廣泛 manifest 掃描

8. Codex harness 推進

  • Codex app-server 跑 context-engine bootstrap、assembly、post-turn maintenance、engine-owned compaction
  • 接受 legacy Codex auth-provider aliases 在 app-server profile login / refresh
  • Codex-native tool hooks 接到 OpenClaw 插件 hooks 和 approvals
  • 提供商自有 transport / auth / follow-up seam,讓 Codex 風格 runtime 能參與 fallback 政策

9. Gradium TTS 加入

新增 Gradium 為 bundled TTS 提供商,支援 voice-note 和電話輸出。

10. Memory hybrid search 透明化

memory-core hybrid search 結果暴露 raw vectorScoretextScore(以及合併 score):

  • 呼叫者可以檢視向量 vs 文字檢索貢獻
  • 在 temporal decay 或 MMR reordering 之前

11. 其他改進

  • Matrix 自我裝置驗證需要完整 cross-signing identity 信任,新增 openclaw matrix verify self CLI
  • WebChat sessions 把 runtime-only prompt context 排除到 visible transcript history 之外
  • agents.defaults.contextInjection: "never" 可關掉 workspace bootstrap 檔案注入
  • 插件 manifest 新增 modelCatalog contract(提供商擁有的 model 行、aliases、suppression rules、discovery mode metadata)

升級建議

  • 想做 Google Meet 自動參與的客戶:直接升級
  • DeepSeek 客戶:可享 V4 Flash / V4 Pro
  • 在意 Talk Mode 體驗的客戶:即時語音 + 完整代理 consult 是大幅升級
  • 想做客服語音電話自動化的客戶:Voice Call 升級值得試
  • 跑大量插件 / 提供商的客戶:啟動更快
  • 開發插件改寫 tool-result 的:注意 Breaking 改用新 API

← v2026.4.23 · v2026.4.25 → · 回到列表