Skip to content
所有標籤

#cost-optimization

4 篇文章
ai guide

Agent CLI 訂閱方案全比較:打造可自由切換的多模型使用模式

比較 2026 年六大 Agent CLI 訂閱方案(Claude Code、Cursor CLI、Codex、Kiro、Gemini CLI、OpenCode),並研究多模型路由模式——簡單任務給便宜模型、複雜任務給強模型,實測可省 40-85% 成本。

ai guide

Multi-Model Routing 開源工具與實作:讓對的模型做對的事

透過多模型路由,將 70% 的簡單任務導向便宜模型,只讓 10-15% 的複雜任務使用旗艦模型,實測節省 40-85% 推論成本。本文介紹五個主要開源工具的架構與實作。

ai guide

OpenClaw 模型進階:Failover、Prompt Caching 與 Token 計費

OpenClaw 內建 Auth 輪替 + Model Fallback 兩階段容錯,加上 Prompt Caching 省錢和完整的 Token 追蹤機制。

ai guide

RAG 成本優化:把每次查詢的花費壓到最低

RAG 系統的成本來自 LLM token、Embedding API、向量搜尋。每個環節都有可以壓成本的地方,但要確認優化沒有犧牲太多品質。