2025 年之前,AI coding assistant 的使用場景大多是補全(Copilot)或問答(ChatGPT)。你輸入,它輸出,你複製貼上,你決定要不要用。
2025 年後,Agent CLI 改變了這個模式。你輸入一個任務,它去讀 codebase、跑測試、改程式碼、提 PR——整個過程你可以去喝咖啡。
這篇介紹 Agent CLI 的設計邏輯、主流工具的差異,以及如何用好它們。每個工具都有各自的詳細專文,這篇作為導覽地圖。
什麼是 Agent CLI
Agent CLI 是跑在終端機的 AI coding agent。和傳統補全工具的根本差異在於:它不只是回答你的問題,而是有能力在你的環境裡採取行動。
典型的能力組合:
- 讀取整個 repo(不只是你選取的片段)
- 執行 shell 指令(跑測試、安裝套件、git 操作)
- 讀寫檔案系統
- 呼叫外部 API 和 MCP 工具
- 在多個步驟之間維持上下文和計畫
這讓它從「問答助手」變成「能夠執行任務的代理」。
主流工具
Claude Code(Anthropic)
由 Anthropic 開發,模型是 Claude Sonnet / Opus。定位是開發者日常工作的主要代理,而非單點輔助工具。
核心設計:CLAUDE.md 系統讓你在 repo 或 ~/.claude/ 放工作守則;Skills 系統把常用工作流程封裝成 slash command;Hooks 在工具呼叫事件插入自動化邏輯;MCP 整合接入外部工具;Sub-agent 架構支援平行派遣子代理。
功能最完整,適合作為主力開發工具。按 Anthropic API token 計費。
→ Claude Code:Anthropic 終端機 AI Coding Agent 完整介紹
Codex CLI(OpenAI)
OpenAI 的開源 Agent CLI(Apache-2.0,71k stars),用 Rust 打造。可綁 ChatGPT 訂閱方案(Plus / Pro / Team / Enterprise)直接使用,或自備 API key。
核心設計:AGENTS.md 系統對應 CLAUDE.md;三種授權模式(suggest / auto-edit / full-auto);沙箱隔離(macOS 用 Apple Sandbox,Linux 用 Docker);完全本地執行,狀態不上傳。
適合需要嚴格控制執行環境、或想自訂 agent 行為的開發者。
→ Codex CLI:OpenAI 開源終端機 Coding Agent 完整介紹
Gemini CLI(Google)
Google 的開源 Agent CLI(Apache 2.0),模型用 Gemini 3 系列。目前 GitHub stars 最高(~99.8k)。亮點是免費額度極大——每分鐘 60 次請求、每天 1,000 次,用 Google 帳號登入即可。
核心設計:GEMINI.md 系統;1M token context window(目前最大);Google 生態整合(Search、Drive、Workspace);MCP 支援。
→ Gemini CLI:Google 開源終端機 AI Agent 完整介紹
OpenCode
開源 AI coding agent(用 Go 打造),內建 TUI 介面。最大特色是支援 75+ LLM——可接 Anthropic、OpenAI、Ollama 本地模型、任何 OpenAI-compatible API。
核心設計:LSP 整合讓 agent 有 IDE 等級的程式碼理解;雙 agent 模式(planning agent + execution agent 分工);Vim 風格編輯器;SQLite session 管理。
→ OpenCode:開源 AI 終端機 Coding Agent 完整介紹
Aider(Paul Gauthier)
最老牌的 terminal pair programming 工具(42.7k+ GitHub stars),純 CLI,Python 打造。支援 100+ LLM,官方推薦 Claude 3.7 Sonnet、DeepSeek R1、OpenAI o1 / o3-mini。最大特色是自動 git commit——每次 AI 修改都自動建立 commit,方便 review 和 rollback。
核心設計:--architect 模式(高能力模型出架構、低成本模型實作);--watch 模式偵測 AI comment 自動觸發;SWE-bench 成績優異。
最適合只想要輕量、可靠的 terminal pair programmer,不需要複雜 agent 功能的開發者。
Pi(Mario Zechner)
極簡主義的開源 coding harness,用 TypeScript 打造,用 Bun runtime 跑。核心只有 4 個工具(read、write、edit、bash)和 300 字 system prompt——設計哲學就是「拒絕複雜度」。
核心設計:透過 Extensions、Skills、Prompt Templates 擴充;Ollama 已內建 ollama launch pi 一鍵啟動;OpenClaw 有深度整合。
→ Pi Coding Agent:極簡主義的開源終端機 Coding Harness
Kiro CLI(AWS)
AWS 官方產品(前身是 Amazon Q Developer CLI),提供 IDE(Code OSS fork)和獨立 CLI 兩種形式。
核心設計:Spec 驅動開發——用 EARS notation 把自然語言需求轉成結構化 requirements + 驗收條件,再生成架構設計和 task list,最後 agent 逐步執行;Agent Hooks 在存檔等事件自動觸發;支援 multimodal 輸入;原生 MCP;模型預設 Claude Sonnet 4.5,或 Auto 模式(混合 Sonnet 4.5 與其他 frontier models 動態切換)。
適合在 AWS 生態重度使用、或偏好 spec-first 開發流程的團隊。官網:kiro.dev
Cursor CLI(Anysphere)
Cursor AI IDE 推出的獨立 CLI,一行安裝:curl https://cursor.com/install -fsS | bash。定位是「在任何環境交付程式碼」——不需要開 IDE,直接在 terminal 跑 agent。
核心設計:支援所有 Cursor 模型(Claude Opus 4.6、GPT-5.2、Gemini 3 Pro、Grok 等);Shell Mode 讓 agent 直接執行 shell 指令並顯示輸出;Headless 模式適合 CI pipeline 和腳本自動化;GitHub Actions 整合可觸發 nightly docs update、安全審查等工作流;MCP 整合。
可獨立使用,不需要搭配 Cursor IDE,適合 CI/CD 自動化或想在 terminal 用 Cursor 訂閱模型的開發者。官網:cursor.com/cli
GitHub Copilot CLI(GitHub / Microsoft)
GitHub 官方的 terminal agent,綁 GitHub Copilot 訂閱方案(Free / Pro / Team / Enterprise),不需額外付費。在 terminal 提供 chat 介面,可自主讀寫檔案、執行指令,完成 bug fix、功能開發、文件更新、測試補全等任務。
核心設計:Autopilot 模式(--allow-all)讓 agent 完全自主執行,不需逐步確認;預設只存取當前目錄下的檔案,跨目錄需要明確授權;支援 custom instructions(.github/copilot-instructions.md)設定專案規範;與 GitHub 生態深度整合(PR review、issue triage、GitHub Actions)。
適合已有 GitHub Copilot 訂閱、且在 GitHub 生態工作的開發者——不需額外開通任何 API。
Amp(Sourcegraph)
Sourcegraph 推出的 CLI-first agent。2026 年初砍掉 editor extension,專注 CLI 路線。強調 frontier model、pay-as-you-go 定價,並公開「Chronicle」展示真實使用案例(含完整 token 消耗和思考過程)。
適合希望透明度高、可觀察 agent 決策過程的開發者。
工具對比一覽
| 工具 | 開源 | 模型 | 特色 | Stars |
|---|---|---|---|---|
| Claude Code | 否 | Claude | Skills + Hooks + Sub-agent,功能最完整 | — |
| Codex CLI | Apache-2.0 | ChatGPT 方案 / API key | 沙箱隔離,三種授權模式 | ~71k |
| Gemini CLI | Apache 2.0 | Gemini 3 系列 | 免費 1,000 次/天,1M context | ~99.8k |
| OpenCode | MIT | 75+ LLM | TUI + LSP,不綁供應商 | — |
| Aider | Apache 2.0 | 100+ LLM | 自動 git commit,最老牌 | ~42.7k |
| Pi | MIT | 任意 | 極簡 4 工具 300 字 prompt | — |
| Kiro CLI | 否 | Claude Sonnet 4.5 / Auto | Spec-first,AWS 官方 | — |
| Cursor CLI | 否 | Claude / GPT-5 / Gemini | IDE 延伸,headless/CI | — |
| GitHub Copilot CLI | 否 | Copilot 模型 | 綁 Copilot 訂閱,GitHub 生態整合 | — |
| Amp | 否 | Frontier | CLI-first,Chronicle 透明展示 | — |
核心設計模式:上下文工程
Agent CLI 好不好用,30% 取決於模型能力,70% 取決於你給它的上下文。
上下文檔案(CLAUDE.md / AGENTS.md / GEMINI.md)——告訴 agent 這個專案的規範、禁止事項、工作流程,以及任何沒辦法從 code 本身推導出來的事。
一個好的上下文檔案:
# Project Context
這個專案是 ... 用 ... 技術棧,部署在 ...
# Commit 規範
每次 commit 使用 conventional commits 格式:feat / fix / docs / refactor
# 不要做的事
- 不要用 `git add .`,逐一加入要 commit 的檔案
- 不要在沒問清楚的情況下刪除檔案
- 測試跑過之前不要 commit
# 工作流程
1. 改程式碼前先讀懂相關的測試
2. 改完跑 `npm test`
3. 用 TDD 方式處理 bug fix
原則:具體指令優於模糊原則(「遵守 clean code」沒用);禁止事項要明確(agent 不知道你覺得理所當然的限制);分層管理(全域放通用習慣,repo 根目錄放專案規範)。
工具使用與授權模式
只讀工具(通常可以自動允許):讀取檔案、搜尋 codebase、git log / diff
寫入工具(建議要求確認):編輯/新建/刪除檔案、git commit / push
執行工具(最高風險):執行 shell 指令、呼叫外部 API
把授權模式設成「完全自動」然後抱怨 agent 做了你不想要的事,是最常見的錯誤。
有效使用的實踐原則
任務分解而非一次全給:
❌ "幫我把這個 codebase 從 REST API 改成 GraphQL"
✅ "先列出所有對外的 REST endpoint,不要動任何程式碼"
→ 確認後:"把 /users GET 和 POST 改成 GraphQL,其他先不動"
讓 agent 先 plan 再 execute:
> claude "我想重構 auth module,先告訴我你打算怎麼做,不要動任何檔案"
把可重複的工作流程封裝起來: 每次 commit 都輸入同樣指示就是應該封裝的訊號。Claude Code 的 Skills、Pi 的 Prompt Templates、Kiro 的 Custom Agents 都是這個用途。
驗證的責任在你: Agent 不會告訴你它做錯了。讓 agent 自己跑測試確認通過、重要操作前看 git diff——這些步驟不能省。
整體來說
選擇邏輯:
Claude Code → 功能最完整,適合主力日常
Codex CLI → 開源可控,適合需要沙箱隔離
Gemini CLI → 免費額度大,適合輕量嘗試或長 context
OpenCode → 不綁 LLM,適合多模型混用或本地部署
Aider → 自動 git commit,適合輕量 pair programming
Pi → 極簡,適合理解底層或客製 harness
Kiro CLI → Spec-first,適合 AWS 生態或規格驅動團隊
Cursor CLI → IDE 延伸,適合 Cursor 用戶補上 terminal/CI
GitHub Copilot CLI → 已有 Copilot 訂閱,適合 GitHub 生態工作者
Amp → 透明度高,適合在意 agent 決策過程
核心取捨:投資上下文工程的前期成本,換取後期每個任務的效率乘數。對在同一個 repo 長期工作的開發者,這個投資回收很快。