成本與用量

AI 不像傳統 SaaS 按座位計費。每一次對話都在消耗 Token,每一個 Token 都有成本。 這個分類讓你搞清楚錢流向哪、怎麼省。


你需要知道的三件事

1. realvco 訂閱費 ≠ AI 使用費

  • realvco 月費:付給 realvco 的主機與維運費用
  • AI 使用費:付給 OpenAI / Anthropic / Google 等 API 供應商

兩筆費用分開計算。訂閱 realvco 你拿到一台主機 + 三個夥伴框架,AI 模型 API Key 是你自己的(或 realvco 代購方案)。

2. Token 是計價單位,不是訊息數

  • 1 個中文字 ≈ 1.5-2 Tokens
  • 1 個英文單字 ≈ 1.3 Tokens
  • AI 的回應也算 Tokens(通常 output 比 input 貴 3-5 倍)
  • 長對話會累積,因為每次請求都帶整段歷史

一段日常對話(你問 100 字、AI 答 300 字)大約 1,000 Tokens。

3. 模型差距很大

同樣處理一段內容,不同模型的價差可達 10 倍以上。請看下方預設模型清單逐款價格對照 — 日常對話用便宜款就夠,不用預設最貴。


預設模型清單

買了 預裝 API 額度 之後,realvco 在 Rose 的 OpenClaw 容器預先裝好下列 4 款 OpenRouter 模型,對話中輸入指令 /model <別名> 即可瞬間切換(完整 alias 機制見 OpenClaw 概況):

別名模型輸入 / 百萬 Tokens輸出 / 百萬 Tokens適合的任務
gmOpenAI GPT-5.4 Mini依即時報價依即時報價日常穩定主力 / 設定調整 / config / env 檢查 / 一般 OpenClaw / Hermes-Agent 操作
dsDeepSeek V4 Pro$0.435$0.87重任務與長上下文 / 複雜 log / 多步驟排錯
hkAnthropic Claude Haiku 4.5$1.00$5.00高風險守門 / Claude 系穩定判斷
gfGoogle Gemini 3.5 Flash依即時報價依即時報價多模態與高階備援 / 價格較貴 / 最終選項

價格說明:2 款 OpenRouter 公開行情(ds / hk)為 2026-05-26 公告;新換 / 升版的 2 款(gm / gf)以 admin-panel 的 用量 子分頁即時報價為準。越往下能力越強、成本越高

模型升級策略:兩次卡住就跳下一級

預設 gm 處理大部分工作。遇到搞不定的事不要硬撐,依任務性質直接挑對應模型:

  1. 預設 GPT-5.4 Mini/model gm)— 日常穩定主力,設定 / config / env 檢查 / 一般 OpenClaw 跟 Hermes-Agent 操作都靠她。
  2. 遇到複雜 log、多步驟排錯、長上下文 → 切 DeepSeek V4 Pro(輸入指令 /model ds)— 重任務首選。
  3. 涉及金額、合規、需要 Claude 系穩定判斷 → 切 Claude Haiku 4.5(輸入指令 /model hk)— 高風險守門。
  4. 要看圖、多模態、其他模型都試過還是卡 → 切 Gemini 3.5 Flash(輸入指令 /model gf)— 價格較貴,當最終備援。

「兩次規則」:每款試了兩次還沒搞定就跳下一級,別在一款上耗超過兩次浪費 token。

怎麼切:在跟 Rose 對話時輸入指令 /model <別名>(例如 /model ds/model hk)然後送出,下一則就用新模型回。

為什麼這樣安排:模型各有強項弱項 — 設定類用 gm 已經夠用;遇到 log / 排錯 那種長 context 任務 ds 表現比較穩;涉及金額 / 合規這類「不能搞砸」的場景 hk 守門最安全;最後 gf 留給多模態需求跟所有都試過還沒通的場景。

Ada / Vi(Hermes-Agent)的模型怎麼選? Hermes-Agent 沒有 OpenClaw 那種固定別名清單;Ada / Vi 第一次用時在 admin-panel 設定 子分頁挑模型即可。可挑的範圍跟 OpenRouter 模型池一致。

使用舊版預設模型的客戶:Rose 早期裝機時預裝的是 4 款(km / mm / sn / op,已下架的模型);現行預設是 gm / ds / hk / gf,想切到新組合在 版本升級 重拉預設即可。


深入主題


快速省錢 TOP 5

如果你現在覺得花太多,優先做這五件事:

  1. 切換日常對話到便宜模型 — Rose 預設是 gm(GPT-5.4 Mini);如果你曾切到 hk(Haiku)或 gf(Gemini)當主模型,切回 gm 立刻省幾倍
  2. 開啟 Context 壓縮 — 長對話自動摘要舊訊息,少帶歷史省錢
  3. 限制單次回應長度 — 設定 maxTokens,避免 AI 寫出一整本小說
  4. 設月預算上限 — 超過就停,避免失控
  5. 量大任務丟給 Ada / Vi(Hermes-Agent) — 反應快、成本省,跟 Rose 分流

每項都在成本優化有詳細步驟。


相關文件