Agent CLI 完整指南：設計邏輯、工具比較與使用原則

TL;DR Agent CLI 不是更聰明的補全工具，而是能讀懂 codebase、執行多步驟任務、操作真實環境的 AI 代理。Claude Code、Codex CLI、Gemini CLI、OpenCode、Aider、Pi、Kiro、Amp、Cursor CLI... 工具越來越多，但底層共享一套設計邏輯——理解這套邏輯，才能真正用好它們。

#agent-cli #claude-code #codex-cli #gemini-cli #opencode #pi #kiro #aider #amp #cursor-cli #agentic-ai #developer-tools #cli #mcp #context-engineering

什麼是 Agent CLI
主流工具
工具對比一覽
核心設計模式：上下文工程
工具使用與授權模式
有效使用的實踐原則
整體來說
參考資料

2025 年之前，AI coding assistant 的使用場景大多是補全（Copilot）或問答（ChatGPT）。你輸入，它輸出，你複製貼上，你決定要不要用。

2025 年後，Agent CLI 改變了這個模式。你輸入一個任務，它去讀 codebase、跑測試、改程式碼、提 PR——整個過程你可以去喝咖啡。

這篇介紹 Agent CLI 的設計邏輯、主流工具的差異，以及如何用好它們。每個工具都有各自的詳細專文，這篇作為導覽地圖。

什麼是 Agent CLI

Agent CLI 是跑在終端機的 AI coding agent。和傳統補全工具的根本差異在於：它不只是回答你的問題，而是有能力在你的環境裡採取行動。

典型的能力組合：

讀取整個 repo（不只是你選取的片段）
執行 shell 指令（跑測試、安裝套件、git 操作）
讀寫檔案系統
呼叫外部 API 和 MCP 工具
在多個步驟之間維持上下文和計畫

這讓它從「問答助手」變成「能夠執行任務的代理」。

主流工具

Claude Code（Anthropic）

由 Anthropic 開發，模型是 Claude Sonnet / Opus。定位是開發者日常工作的主要代理，而非單點輔助工具。

核心設計：CLAUDE.md 系統讓你在 repo 或 ~/.claude/ 放工作守則；Skills 系統把常用工作流程封裝成 slash command；Hooks 在工具呼叫事件插入自動化邏輯；MCP 整合接入外部工具；Sub-agent 架構支援平行派遣子代理。

功能最完整，適合作為主力開發工具。按 Anthropic API token 計費。

→ Claude Code：Anthropic 終端機 AI Coding Agent 完整介紹

Codex CLI（OpenAI）

OpenAI 的開源 Agent CLI（Apache-2.0，71k stars），用 Rust 打造。可綁 ChatGPT 訂閱方案（Plus / Pro / Team / Enterprise）直接使用，或自備 API key。

核心設計：AGENTS.md 系統對應 CLAUDE.md；三種授權模式（suggest / auto-edit / full-auto）；沙箱隔離（macOS 用 Apple Sandbox，Linux 用 Docker）；完全本地執行，狀態不上傳。

適合需要嚴格控制執行環境、或想自訂 agent 行為的開發者。

→ Codex CLI：OpenAI 開源終端機 Coding Agent 完整介紹

Gemini CLI（Google）

Google 的開源 Agent CLI（Apache 2.0），模型用 Gemini 3 系列。目前 GitHub stars 最高（~99.8k）。亮點是免費額度極大——每分鐘 60 次請求、每天 1,000 次，用 Google 帳號登入即可。

核心設計：GEMINI.md 系統；1M token context window（目前最大）；Google 生態整合（Search、Drive、Workspace）；MCP 支援。

→ Gemini CLI：Google 開源終端機 AI Agent 完整介紹

OpenCode

開源 AI coding agent（用 Go 打造），內建 TUI 介面。最大特色是支援 75+ LLM——可接 Anthropic、OpenAI、Ollama 本地模型、任何 OpenAI-compatible API。

核心設計：LSP 整合讓 agent 有 IDE 等級的程式碼理解；雙 agent 模式（planning agent + execution agent 分工）；Vim 風格編輯器；SQLite session 管理。

→ OpenCode：開源 AI 終端機 Coding Agent 完整介紹

Aider（Paul Gauthier）

最老牌的 terminal pair programming 工具（42.7k+ GitHub stars），純 CLI，Python 打造。支援 100+ LLM，官方推薦 Claude 3.7 Sonnet、DeepSeek R1、OpenAI o1 / o3-mini。最大特色是自動 git commit——每次 AI 修改都自動建立 commit，方便 review 和 rollback。

核心設計：--architect 模式（高能力模型出架構、低成本模型實作）；--watch 模式偵測 AI comment 自動觸發；SWE-bench 成績優異。

最適合只想要輕量、可靠的 terminal pair programmer，不需要複雜 agent 功能的開發者。

Pi（Mario Zechner）

極簡主義的開源 coding harness，用 TypeScript 打造，用 Bun runtime 跑。核心只有 4 個工具（read、write、edit、bash）和 300 字 system prompt——設計哲學就是「拒絕複雜度」。

核心設計：透過 Extensions、Skills、Prompt Templates 擴充；Ollama 已內建 ollama launch pi 一鍵啟動；OpenClaw 有深度整合。

→ Pi Coding Agent：極簡主義的開源終端機 Coding Harness

Kiro CLI（AWS）

AWS 官方產品（前身是 Amazon Q Developer CLI），提供 IDE（Code OSS fork）和獨立 CLI 兩種形式。

核心設計：Spec 驅動開發——用 EARS notation 把自然語言需求轉成結構化 requirements + 驗收條件，再生成架構設計和 task list，最後 agent 逐步執行；Agent Hooks 在存檔等事件自動觸發；支援 multimodal 輸入；原生 MCP；模型預設 Claude Sonnet 4.5，或 Auto 模式（混合 Sonnet 4.5 與其他 frontier models 動態切換）。

適合在 AWS 生態重度使用、或偏好 spec-first 開發流程的團隊。官網：kiro.dev

Cursor CLI（Anysphere）

Cursor AI IDE 推出的獨立 CLI，一行安裝：curl https://cursor.com/install -fsS | bash。定位是「在任何環境交付程式碼」——不需要開 IDE，直接在 terminal 跑 agent。

核心設計：支援所有 Cursor 模型（Claude Opus 4.6、GPT-5.2、Gemini 3 Pro、Grok 等）；Shell Mode 讓 agent 直接執行 shell 指令並顯示輸出；Headless 模式適合 CI pipeline 和腳本自動化；GitHub Actions 整合可觸發 nightly docs update、安全審查等工作流；MCP 整合。

可獨立使用，不需要搭配 Cursor IDE，適合 CI/CD 自動化或想在 terminal 用 Cursor 訂閱模型的開發者。官網：cursor.com/cli

GitHub Copilot CLI（GitHub / Microsoft）

GitHub 官方的 terminal agent，綁 GitHub Copilot 訂閱方案（Free / Pro / Team / Enterprise），不需額外付費。在 terminal 提供 chat 介面，可自主讀寫檔案、執行指令，完成 bug fix、功能開發、文件更新、測試補全等任務。

核心設計：Autopilot 模式（--allow-all）讓 agent 完全自主執行，不需逐步確認；預設只存取當前目錄下的檔案，跨目錄需要明確授權；支援 custom instructions（.github/copilot-instructions.md）設定專案規範；與 GitHub 生態深度整合（PR review、issue triage、GitHub Actions）。

適合已有 GitHub Copilot 訂閱、且在 GitHub 生態工作的開發者——不需額外開通任何 API。

Amp（Sourcegraph）

Sourcegraph 推出的 CLI-first agent。2026 年初砍掉 editor extension，專注 CLI 路線。強調 frontier model、pay-as-you-go 定價，並公開「Chronicle」展示真實使用案例（含完整 token 消耗和思考過程）。

適合希望透明度高、可觀察 agent 決策過程的開發者。

工具對比一覽

工具	開源	模型	特色	Stars
Claude Code	否	Claude	Skills + Hooks + Sub-agent，功能最完整	—
Codex CLI	Apache-2.0	ChatGPT 方案 / API key	沙箱隔離，三種授權模式	~71k
Gemini CLI	Apache 2.0	Gemini 3 系列	免費 1,000 次/天，1M context	~99.8k
OpenCode	MIT	75+ LLM	TUI + LSP，不綁供應商	—
Aider	Apache 2.0	100+ LLM	自動 git commit，最老牌	~42.7k
Pi	MIT	任意	極簡 4 工具 300 字 prompt	—
Kiro CLI	否	Claude Sonnet 4.5 / Auto	Spec-first，AWS 官方	—
Cursor CLI	否	Claude / GPT-5 / Gemini	IDE 延伸，headless/CI	—
GitHub Copilot CLI	否	Copilot 模型	綁 Copilot 訂閱，GitHub 生態整合	—
Amp	否	Frontier	CLI-first，Chronicle 透明展示	—

核心設計模式：上下文工程

Agent CLI 好不好用，30% 取決於模型能力，70% 取決於你給它的上下文。

上下文檔案（CLAUDE.md / AGENTS.md / GEMINI.md）——告訴 agent 這個專案的規範、禁止事項、工作流程，以及任何沒辦法從 code 本身推導出來的事。

一個好的上下文檔案：

# Project Context
這個專案是 ... 用 ... 技術棧，部署在 ...

# Commit 規範
每次 commit 使用 conventional commits 格式：feat / fix / docs / refactor

# 不要做的事
- 不要用 `git add .`，逐一加入要 commit 的檔案
- 不要在沒問清楚的情況下刪除檔案
- 測試跑過之前不要 commit

# 工作流程
1. 改程式碼前先讀懂相關的測試
2. 改完跑 `npm test`
3. 用 TDD 方式處理 bug fix

原則：具體指令優於模糊原則（「遵守 clean code」沒用）；禁止事項要明確（agent 不知道你覺得理所當然的限制）；分層管理（全域放通用習慣，repo 根目錄放專案規範）。

工具使用與授權模式

只讀工具（通常可以自動允許）：讀取檔案、搜尋 codebase、git log / diff

寫入工具（建議要求確認）：編輯/新建/刪除檔案、git commit / push

執行工具（最高風險）：執行 shell 指令、呼叫外部 API

把授權模式設成「完全自動」然後抱怨 agent 做了你不想要的事，是最常見的錯誤。

有效使用的實踐原則

任務分解而非一次全給：

❌ "幫我把這個 codebase 從 REST API 改成 GraphQL"
✅ "先列出所有對外的 REST endpoint，不要動任何程式碼"
   → 確認後："把 /users GET 和 POST 改成 GraphQL，其他先不動"

讓 agent 先 plan 再 execute：

> claude "我想重構 auth module，先告訴我你打算怎麼做，不要動任何檔案"

把可重複的工作流程封裝起來： 每次 commit 都輸入同樣指示就是應該封裝的訊號。Claude Code 的 Skills、Pi 的 Prompt Templates、Kiro 的 Custom Agents 都是這個用途。

驗證的責任在你： Agent 不會告訴你它做錯了。讓 agent 自己跑測試確認通過、重要操作前看 git diff——這些步驟不能省。

整體來說

選擇邏輯：
Claude Code   → 功能最完整，適合主力日常
Codex CLI     → 開源可控，適合需要沙箱隔離
Gemini CLI    → 免費額度大，適合輕量嘗試或長 context
OpenCode      → 不綁 LLM，適合多模型混用或本地部署
Aider         → 自動 git commit，適合輕量 pair programming
Pi            → 極簡，適合理解底層或客製 harness
Kiro CLI      → Spec-first，適合 AWS 生態或規格驅動團隊
Cursor CLI    → IDE 延伸，適合 Cursor 用戶補上 terminal/CI
GitHub Copilot CLI → 已有 Copilot 訂閱，適合 GitHub 生態工作者
Amp           → 透明度高，適合在意 agent 決策過程

核心取捨：投資上下文工程的前期成本，換取後期每個任務的效率乘數。對在同一個 repo 長期工作的開發者，這個投資回收很快。