v2026.4.23 — 圖片生成擴展 + GPT-5.5 + 安全大批次

發布日期:2026 年 4 月 23 日
定位:圖片提供商擴展 + GPT-5.5 預備 + 安全強化
Breaking Changes:無


核心亮點

1. OpenAI Codex OAuth 圖片生成

openai/gpt-image-2 現在可以走 Codex OAuth:

  • 不需要 OPENAI_API_KEY
  • 直接用 ChatGPT 帳號跑圖片
  • 也支援參考圖片編輯

2. OpenRouter 圖片生成

OpenRouter 支援圖片生成和參考圖片編輯:

  • OPENROUTER_API_KEY 跑 OpenRouter 的圖片模型
  • 經由 image_generate 工具呼叫

3. 圖片生成更多控制

代理人可以請求提供商支援的品質和輸出格式:

  • OpenAI 的 background、moderation、compression、user 等 hint 都可以透過 image_generate 工具帶入
  • 多參考圖編輯改用受保護的 multipart upload,恢復複雜的 gpt-image-2 編輯

4. Subagents 可選的 forked context

原生 sessions_spawn 跑子代理時,新增可選的 forked context:

  • 子代理可以繼承發起者的對話 transcript
  • 預設仍保持乾淨隔離 session
  • 包含 prompt 指引、context engine hook metadata、文件、QA 覆蓋

5. Pi 0.70.0 + GPT-5.5 預備

Bundled Pi 套件升到 0.70.0,OpenAI 和 OpenAI Codex 用 Pi 上游的 gpt-5.5 catalog metadata,本地僅保留 gpt-5.5-pro 的 forward-compat 處理。

6. Dreaming 改成獨立輕量代理跑

把 managed dreaming cron 從 heartbeat 解耦,改成 isolated lightweight agent turn:

  • Heartbeat 對 default agent 關掉,dreaming 仍會跑
  • 不會再被 heartbeat.activeHours 跳過
  • openclaw doctor --fix 會把舊的 main-session dreaming jobs 在持久化 cron config 裡遷移到新 shape

7. WebChat 圖片附件保留

WebChat 把圖片附件 offload 成 media refs,給 text-only 主模型用:

  • 圖片不再被丟掉
  • 配置的圖片工具仍能檢視原始檔
  • 修復 #68513、#44276、#51656、#70212

8. 大批次安全修補(12+ 項)

  • Discord:原生 slash 指令的頻道政策不能繞過 owner / member 限制
  • Teams:強制 Bot Framework audience tokens 透過 appidazp 比對到設定的 Teams app(防 cross-bot replay)
  • WhatsApp:contact / vCard / location 結構化物件改用 fenced untrusted metadata JSON 渲染,限制隱藏的 prompt-injection
  • Group 對話:頻道來源的群組名稱和參與者標籤改用 fenced untrusted metadata JSON
  • AndroidASK_OPENCLAW intents 不再自動傳送注入的 prompt,外部 app 動作只 prefill draft
  • Pairing:行動裝置 cleartext 配對需要私網 IP 或 loopback;.local 不再被當成安全 cleartext
  • Approvalsconfig.apply/config.patch 的 agent-driven 編輯改用允許清單(narrow allow),不再依賴黑名單
  • WebhooksSecretRef 來源的 webhook secrets 每次 request 重新解析,secrets reload 立即撤銷舊 secret
  • MCP/tools:ACPX OpenClaw tools bridge 不能列出或呼叫 owner-only 工具(如 cron
  • QQBot/bot-approve 需要 framework auth
  • Anthropic CLIbypassPermissions 從 OpenClaw 自己的 YOLO exec policy 推導,保留 explicit --permission-mode 覆寫
  • Secrets/Windows:file-backed secrets 移除 UTF-8 BOM,ACL 檢查 fail-closed

9. WebChat / 對話可靠度

  • WebChat 把 text-only 模型回覆裡可以拿出的圖片附件保留住
  • Stop 按鈕跨 Gateway 重連排隊,斷線中的 active run 在重連時取消
  • Active 助理生成的圖片儲存成 authenticated managed media,配對裝置 token 也能 fetch
  • WebChat session-mutation guard 擴展到 sessions.compactsessions.compaction.restore

10. 外部頻道修復

  • Telegram 媒體回覆把 markdown 圖片語法 ![...](...) 解析成 outbound media payload(而不是純 URL)
  • Slack MPIM 群組 DM 分類成 group chat context,內部「Working…」trace 不會洩漏到房間
  • BlueBubbles iMessage 優先於 SMS,不會靜默降級
  • Voice-call realtime 等待 OpenAI session 配置完成才打招呼或轉發 buffered audio

升級建議

  • 用 ChatGPT Plus / Pro 想跑圖片但沒有 API key 的客戶:可走 Codex OAuth
  • 用 OpenRouter 的客戶:可以開始跑圖片
  • 跑 dreaming 的客戶:建議升級避免 cron 路徑遺漏
  • WebChat 配多模態的客戶:圖片附件不會再被丟掉
  • 所有人:含大批次安全修補,建議升級

← v2026.4.22 · v2026.4.24 → · 回到列表