Agent CLI 訂閱方案全比較：打造可自由切換的多模型使用模式

TL;DR 比較 2026 年六大 Agent CLI 訂閱方案（Claude Code、Cursor CLI、Codex、Kiro、Gemini CLI、OpenCode），並研究多模型路由模式——簡單任務給便宜模型、複雜任務給強模型，實測可省 40-85% 成本。

#agent-cli #multi-model-routing #claude-code #cursor #codex #kiro #gemini-cli #opencode #llm-router #cost-optimization

2026 年，AI coding agent 已經從「輔助工具」變成「開發主力」。本文聚焦於有終端 CLI agent 的工具——可以直接在 terminal 裡跑的 coding agent。

這篇文章做兩件事：

橫向比較六大 Agent CLI 的訂閱方案
深入研究 Multi-Model Routing 模式——讓簡單任務自動用便宜模型、複雜任務才動用旗艦模型

六大 Agent CLI 訂閱方案總覽

工具	入門價	重度使用	模型策略	最適合
Claude Code	$20/mo	$100-200/mo	Opus/Sonnet/Haiku 手動切換	深度推理、複雜任務
Cursor CLI	免費 / $20/mo	$60-200/mo	Auto + 多供應商	IDE ↔ CLI 無縫切換
OpenAI Codex CLI	免費 / $20/mo	$200/mo	GPT-5.4 + mini 自動路由	OpenAI 生態系
Kiro CLI	免費 (50 credits)	$200/mo	Auto 模式自動切換	AWS 生態系
Gemini CLI	免費 (1000 req/day)	$20-42/mo	Gemini 2.5 Pro, 1M context	免費重度使用
OpenCode	免費 (開源)	按 API 計費	75+ 模型供應商自由切換	模型自由、vendor 獨立

各工具定位與特色

商業訂閱制

Claude Code — Anthropic 的終端 agent，推理深度業界最強。Pro $20/mo（Sonnet 為主），Max $100-200/mo 解鎖 Opus 並吃到飽。有開發者 8 個月用了 100 億 tokens，月費 $100，同樣用量走 API 要 $15,000。Subagent 架構可指定 Haiku 處理簡單任務。

Cursor CLI — 將 Cursor IDE 的 Agent 帶入終端。Interactive TUI + headless 模式，支援 Plan/Ask/Agent 三種模式。獨家 Cloud Handoff：CLI 對話推上雲端繼續跑，手機或網頁接回。Pro $20/mo，Ultra $200/mo。Background Agents 可平行 8 個任務。

OpenAI Codex CLI — 綁定 ChatGPT 訂閱，Plus $20/mo、Pro $200/mo。亮點是 內建模型路由：GPT-5.4 做規劃，GPT-5.4 mini 做子任務（只消耗 30% 配額）。CLI 支援 Plan 模式（用訂閱額度）與 API Key 模式（按 token 計費）雙軌。

Kiro CLI — AWS 出品，實作 Agent Client Protocol (ACP)。免費 50 credits，Pro $20/mo 起。Auto 模式自動混合 Sonnet/Opus 等模型。Spec-Driven 開發流程是獨特賣點，Agent Hooks 實現本地自動化。

免費 / 開源

Gemini CLI — Google 開源，免費額度業界最慷慨：60 req/min、1,000 req/day，含 Gemini 2.5 Pro 和 1M token context window。Google 分析內部開發者使用量後，免費額度設為最高使用量的兩倍，意味著大多數人根本不需要付費。

OpenCode — 開源 Go 語言 CLI，95K+ GitHub stars。支援 75+ 模型供應商（含本地 Ollama），可用 GitHub Copilot 或 ChatGPT Plus 帳號認證。完全免費，只付你選的模型 API 費用。

價格帶分析

免費：能走多遠？

工具	免費額度	可用模型	限制
Gemini CLI	1,000 req/day	Gemini 2.5 Pro	最慷慨，多數人夠用
OpenCode	無限（開源）	75+ 供應商	需自備 API key
Kiro CLI	50 credits（永久）	Auto 模式	額度用完就沒了
Codex CLI	有限免費額度（ChatGPT Free）	GPT-5.4 mini	需 ChatGPT 帳號，用量受限
Cursor CLI	免費方案（Hobby）	Auto 模式（有限）	每月 2,000 completions

$20/月：主流級

Claude Code Pro、Cursor Pro、Codex Plus、Kiro Pro 都在這個價位。Claude Code 用 Sonnet，Cursor 用 Auto mode，Codex 用 GPT-5.2，Kiro 用 Auto 模式。實際可用量差異大。

$100-200/月：重度使用

方案	價格	相對 Pro 的用量
Cursor Pro+	$60	3x
Claude Code Max 5x	$100	5x + Opus
Claude Code Max 20x	$200	20x + Opus
Cursor Ultra	$200	20x
Codex Pro	$200	6-7x
Kiro Power	$200	最高額度

Claude Code Max 方案的亮點是吃到飽定價，重度使用者的最佳選擇。

Multi-Model Routing：核心概念

為什麼需要模型路由？

不是每個任務都需要 Opus。實際上：

~70% 的任務：簡單查詢、格式化、改 typo → Haiku 就夠
~15-20% 的任務：日常開發、code review → Sonnet 最佳
~10-15% 的任務：架構設計、多檔重構、複雜 debug → 需要 Opus

盲目全用旗艦模型，等於 70% 的花費是浪費。

三層模型架構

實務證明，三層是最佳平衡點（超過三層增加複雜度但無顯著收益）：

┌─────────────────────────────────────────┐
│  Tier 3: Deep / 深度模式                │
│  Opus 4.6 / GPT-5.4                     │
│  架構決策、多檔重構、新問題解決          │
│  ~$15-30 / M tokens                     │
├─────────────────────────────────────────┤
│  Tier 2: Standard / 標準模式            │
│  Sonnet 4.6 / DeepSeek R1              │
│  日常開發、研究、內容生成               │
│  ~$3-8 / M tokens                       │
├─────────────────────────────────────────┤
│  Tier 1: Quick / 快速模式              │
│  Haiku / Gemini Flash-Lite / DeepSeek V3│
│  心跳、快速查詢、分類                   │
│  ~$0.5-1 / M tokens                     │
└─────────────────────────────────────────┘

路由判斷維度

主流路由器使用的評估維度：

Token 數量：長 prompt 通常代表複雜任務
程式碼存在：有程式碼的任務通常更需要推理能力
推理標記：出現 “why”, “analyze”, “design”, “architect” 等關鍵字
技術術語密度：高密度暗示專業任務
上下文長度：需要理解大量上下文的任務需要更強模型
輸出品質敏感度：面向使用者的輸出需要更高品質

路由策略

Budget Ladder（預算階梯）：

1. 先用 Tier 1 嘗試
2. 驗證輸出品質
3. 品質不足 → 升級到 Tier 2 重試
4. 仍不足 → 升級到 Tier 3

適合：資料擷取、標記、短回覆等可驗證品質的任務。

Classifier Routing（分類器路由）：

1. 分類器分析請求複雜度（< 1ms）
2. 直接路由到對應 tier
3. 無需重試

適合：即時回應需求高的場景。

成本節省實例

使用者類型	無路由月費	有路由月費	節省
輕度使用	$200	$70	65%
中度使用	$500	$150	70%
重度使用	$943	$347	63%

各家 CLI 的路由機制

已內建自動路由

OpenAI Codex CLI：GPT-5.4 做規劃與判斷，GPT-5.4 mini 處理子任務（只消耗 30% 配額）
Kiro CLI：Auto 模式結合大小模型，自動意圖識別與快取優化

支援手動切換

Claude Code：可在 Opus / Sonnet / Haiku 間切換，搭配 subagent 架構
Cursor CLI：Auto mode 自動選模型，也可手動指定 Anthropic/OpenAI/Gemini
Gemini CLI：可選擇不同 Gemini 模型，免費方案由系統自動分配

完全自由選擇

OpenCode：75+ 供應商，session 中途切換模型不丟上下文，搭配第三方路由器最靈活

開源路由工具

詳細介紹請見 Multi-Model Routing 開源工具與實作，這裡列出重點：

工具	特色	GitHub
ruflo	Claude 專用編排平台，CLI 內建任務分析	ruvnet/ruflo
iblai-openclaw-router	14 維度加權評分器，< 1ms 決策	iblai/iblai-openclaw-router
freerouter	自架路由器，支援手動覆蓋 `/max`	openfreerouter/freerouter
agent-router	多 agent 智能路由，含負載均衡	dabit3/agent-router
llm-router	NVIDIA 官方藍圖，意圖分析	NVIDIA-AI-Blueprints/llm-router

設計你自己的多模型切換系統

如果要自建，建議的架構：

User Request
    │
    ▼
┌──────────────┐
│  Classifier  │  ← 14 維度評分（< 1ms）
│  (Haiku)     │
└──────┬───────┘
       │
   ┌───┴───┐
   ▼       ▼        ▼
┌──────┐ ┌──────┐ ┌──────┐
│Quick │ │ Std  │ │ Deep │
│Haiku │ │Sonnet│ │ Opus │
└──────┘ └──────┘ └──────┘

關鍵設計原則

自動 + 手動覆蓋：自動判斷為主，但允許 /max、/quick 等指令強制指定
三層就夠：Simple → Medium → Complex，超過三層徒增複雜度
分類器要用最便宜的模型：分類本身不該花太多成本
監控與調整：追蹤每層的使用比例，持續調整分類閾值

結論

2026 年的 Agent CLI 市場已經成熟到「不缺選擇，缺的是策略」。

零成本起步：Gemini CLI（1,000 req/day 免費）或 OpenCode（開源 + 自選 API）是最佳入門。

專業使用：Claude Code Max（$100/mo 吃到飽 + Opus）或 Codex Pro（$200/mo + 內建路由）。

最大靈活性：OpenCode + 第三方路由器（freerouter / ruflo），75+ 模型隨意切換。

不管哪種方案，核心原則不變：把對的模型，用在對的任務上。

Agent CLI 訂閱方案全比較：打造可自由切換的多模型使用模式

六大 Agent CLI 訂閱方案總覽

各工具定位與特色

商業訂閱制

免費 / 開源

價格帶分析

免費：能走多遠？

$20/月：主流級

$100-200/月：重度使用

Multi-Model Routing：核心概念

為什麼需要模型路由？

三層模型架構

路由判斷維度

路由策略

成本節省實例

各家 CLI 的路由機制

已內建自動路由

支援手動切換

完全自由選擇

開源路由工具

設計你自己的多模型切換系統

關鍵設計原則

結論

系列文章

參考資料

Agent CLI 訂閱方案全比較：打造可自由切換的多模型使用模式

六大 Agent CLI 訂閱方案總覽

各工具定位與特色

商業訂閱制

免費 / 開源

價格帶分析

免費：能走多遠？

$20/月：主流級

$100-200/月：重度使用

Multi-Model Routing：核心概念

為什麼需要模型路由？

三層模型架構

路由判斷維度

路由策略

成本節省實例

各家 CLI 的路由機制

已內建自動路由

支援手動切換

完全自由選擇

開源路由工具

設計你自己的多模型切換系統

關鍵設計原則

結論

系列文章

參考資料

相關文章 · #agent-cli