v2026.4.24 — Google Meet 加入 + DeepSeek V4 + Talk 即時語音
發布日期:2026 年 4 月 24 日
定位:頻道 / 模型 / 即時語音三線擴充
Breaking Changes:移除 api.registerEmbeddedExtensionFactory(...) Pi-only 相容路徑(插件改用 api.registerAgentToolResultMiddleware(...))
核心亮點
1. Google Meet 加入 OpenClaw
Google Meet 變成 bundled 參與者插件:
- 個人 Google 認證
- 明確 meeting URL 加入會議
- Chrome 和 Twilio 即時音訊傳輸
- 配對節點
chrome-node支援(Parallels 風格的 Chrome/BlackHole/SoX 主機) - 直播語音裡可以 consult 完整 OpenClaw agent
- 文物(artifact)和出席紀錄匯出工作流(會議記錄、錄音、轉錄、smart notes、參與者 sessions)
- 已開啟 Meet tab 的恢復工具:
recover_current_tab、recover-tab不會打開重複 tab
2. DeepSeek V4 加入
DeepSeek V4 Flash 和 V4 Pro 進入 bundled catalog:
- V4 Flash 是 onboarding 預設
- 修復後續 tool-call 輪次的 thinking / replay 行為
3. Talk Mode 即時語音 + 完整代理 consult
Talk、Voice Call、Google Meet 可用即時語音迴圈,並 consult 完整 OpenClaw agent 取更深的工具背書答案:
- 瀏覽器 WebRTC 即時語音 session 支援 OpenAI Realtime
- Gateway 簽發短效 client secret
openclaw_agent_consult把難題交給完整代理人
不再受限於即時語音模型本身的工具能力。
4. Voice Call 與 Gemini Live
- 新增 Gemini Live 即時語音提供商(給 Voice Call、Google Meet 音訊橋)
- 雙向音訊 + function-call 支援
- 新增
voicecall setup和 dry-run 預設的voicecall smoke指令,讓 Twilio / 提供商準備度可在打測試電話前先檢查
5. Browser 自動化升級
- 視窗座標點擊(不再只能 a11y refs):
openclaw browser click-coords - 動作預算預設拉到 60 秒(
browser.actionTimeoutMs可調) - per-profile
browser.profiles.<name>.headless覆寫(一個 profile 可以跑 headless 不必全部跑 headless) - tab 重用 / 恢復更穩定
6. Control UI Tool Access 重做
- 緊湊的 live-tool 晶片
- 可摺疊的工具群組
- 直接 per-tool 切換
- 更清楚的 runtime / source 來源
- 聊天裡 queued 訊息加 Steer 動作,可以把 follow-up 注入到 active run 不必重新打字
7. 模型 / 插件啟動加速
- bundled 提供商用安全的靜態 catalogs,啟動
models list變快 - 模型 catalog 走 manifest-sourced 的 row、duplicate 衝突回報、共用
src/model-catalog標準化 node-llama-cpp預設不再裝(local embeddings 在 operator 裝可選 runtime 套件後才載)- 大幅減少啟動廣泛 manifest 掃描
8. Codex harness 推進
- Codex app-server 跑 context-engine bootstrap、assembly、post-turn maintenance、engine-owned compaction
- 接受 legacy Codex auth-provider aliases 在 app-server profile login / refresh
- Codex-native tool hooks 接到 OpenClaw 插件 hooks 和 approvals
- 提供商自有 transport / auth / follow-up seam,讓 Codex 風格 runtime 能參與 fallback 政策
9. Gradium TTS 加入
新增 Gradium 為 bundled TTS 提供商,支援 voice-note 和電話輸出。
10. Memory hybrid search 透明化
memory-core hybrid search 結果暴露 raw vectorScore 和 textScore(以及合併 score):
- 呼叫者可以檢視向量 vs 文字檢索貢獻
- 在 temporal decay 或 MMR reordering 之前
11. 其他改進
- Matrix 自我裝置驗證需要完整 cross-signing identity 信任,新增
openclaw matrix verify selfCLI - WebChat sessions 把 runtime-only prompt context 排除到 visible transcript history 之外
agents.defaults.contextInjection: "never"可關掉 workspace bootstrap 檔案注入- 插件 manifest 新增
modelCatalogcontract(提供商擁有的 model 行、aliases、suppression rules、discovery mode metadata)
升級建議
- 想做 Google Meet 自動參與的客戶:直接升級
- DeepSeek 客戶:可享 V4 Flash / V4 Pro
- 在意 Talk Mode 體驗的客戶:即時語音 + 完整代理 consult 是大幅升級
- 想做客服語音電話自動化的客戶:Voice Call 升級值得試
- 跑大量插件 / 提供商的客戶:啟動更快
- 開發插件改寫 tool-result 的:注意 Breaking 改用新 API