單一模型會有盲點,這件事所有用過 agentic coding 的人都同意。Claude Octopus 是 nyldn 做的 Claude Code plugin,核心想法很直接:一次把最多 8 個模型掛在同一個任務上,彼此互審,意見不合就擋下來。這篇整理它的架構、指令、persona 系統、以及和其他 Claude Code 增強層(例如 oh-my-claudecode)相比的差異。
定位:不是另一個 agent,是一層共識閘門
Octopus 在 Claude Code 裡是一個 plugin,不是 fork 也不是 wrapper。它只佔用 /octo:* 這個 namespace 和自然語言前綴 octo,其他 Claude Code 行為完全不動。這個設計很重要——你可以裝起來試,不滿意一行指令就乾淨卸載,沒有殘留設定。
它要解決的問題不是「自動寫更多 code」,而是「在 ship 之前,讓另外 7 個模型先罵一輪」。Octopus 把 consensus gate 當成第一原則:預設 75% 的 provider 要同意,工作才能過 gate,否則整條管線就停下來給人看。
八個 tentacle:多 provider 協作
預設支援的 provider 有八種,每個角色不同:
| Provider | 角色 | 認證方式 | 費用 |
|---|---|---|---|
| Claude | Orchestration、synthesis | Claude Code 內建 | 依 Claude 訂閱 |
| Codex (OpenAI) | Implementation、code pattern 深度 | codex login 或 OPENAI_API_KEY | OAuth 免費或 per-token |
| Gemini (Google) | 生態廣度、security review | Google OAuth 或 GEMINI_API_KEY | OAuth 免費或 per-token |
| Copilot (GitHub) | Research 零成本跑腿 | 沿用 GitHub 訂閱 | 免費 |
| Qwen (Alibaba) | Research tier | Qwen OAuth | 每日 1,000–2,000 次免費 |
| Ollama | 本地、離線、隱私敏感任務 | 本地安裝 | 免費 |
| Perplexity | Live web search、CVE 查詢 | API key | 依 API |
| OpenRouter | 100+ 模型 routing | API key | 依模型 |
重點是零 provider 也能跑——只有 Claude 的話 Octopus 就退化成有 persona 和 slash command 的單模型 harness。每加一個 provider 就自動偵測啟用,不用手動配 pipeline。
Double Diamond 四階段
Octopus 把 UK Design Council 的 Double Diamond 方法論直接搬到 coding agent 上,分四個階段:
| 階段 | 指令 | 做什麼 |
|---|---|---|
| Discover | /octo:discover | 多 AI 研究、探索問題空間 |
| Define | /octo:define | 用共識釐清需求、寫 spec |
| Develop | /octo:develop | 開始實作、帶 quality gate |
| Deliver | /octo:deliver | Adversarial review + go/no-go 打分 |
你可以單獨呼叫任一階段,也可以 /octo:embrace 一次跑完整條管線。相較於「直接丟一句 prompt 給 Claude 寫 code」,這套流程的差別是定義階段先讓多模型吵架——spec 寫清楚再進到 develop,省掉 80% 的「做完才發現需求理解錯」。
八隻核心觸手(Primary Commands)
/octo:embrace # 整條 lifecycle:research → define → develop → deliver
/octo:factory # Autonomous spec-to-software(Dark Factory)
/octo:debate # 四 AI 結構化辯論 + 共識
/octo:research # 三 provider 多源綜合
/octo:design # UI/UX 設計(含 BM25 retrieval)
/octo:tdd # Red-green-refactor 紀律
/octo:security # OWASP 漏洞掃描 + 修復
/octo:prd # AI-optimized 產品需求文件
加上 review / debug / extract / docs / schedule / parallel / sentinel / optimize / brainstorm / doctor / quick 等延伸指令,整個 plugin 有 48 個 slash command。想偷懶就用 smart router:
/octo:auto <description>
它會解析自然語言意圖,自己選要跑哪條 workflow。
32 個 persona:context-aware agent
Octopus 預先定義了 32 個特化角色,根據 request 自動套用:
- Software Engineering(11):backend-architect、frontend-architect、fullstack-engineer、devops-engineer、security-auditor、performance-optimizer、testing-strategist、database-specialist、api-designer、integration-engineer、systems-engineer
- Specialized Development(6):mobile-engineer、ml-engineer、data-engineer、blockchain-engineer、iot-engineer、game-developer
- Documentation / Communication(5):technical-writer、product-manager、business-analyst、ux-writer、content-strategist
- Research / Strategy(3):researcher、strategist、analyst
- Business / Compliance(3):compliance-officer、financial-analyst、legal-advisor
- Creative / Design(4):ui-ux-designer、graphic-designer、creative-director、brand-strategist
一個「review 這支 API」的 request 可能同時觸發 api-designer + security-auditor + performance-optimizer,每個 persona 用不同 provider 回一份審查,最後在 consensus gate 收斂。
Dark Factory:給 spec 就走到底
Dark Factory 是最激進的模式——把一份 spec 丟進去,Octopus 完全自動跑完 Discover → Define → Develop → Deliver,中間不問人:
/octo:factory "build a CLI that converts CSV to JSON"
有三個 autonomy level:
- Supervised:每個 phase 都要人工 approve
- Semi-autonomous:只有失敗才介入
- Autonomous:整條跑完才回頭看
搭配 git worktree 做 workstream isolation,可以讓多個並行任務在各自 branch 跑,最後自動 merge、處理衝突。
Reaction Engine:自動回應 lifecycle 事件
這是我覺得最「team-aware」的設計。Reaction Engine 監聽 CI、review、PR 的狀態變化,自動回應:
| 事件 | 動作 | 最大重試 | Escalation |
|---|---|---|---|
| CI failure | 收 log 丟 agent inbox | 3 | 30 分鐘後找人 |
| Changes requested | 收 review comment 丟 inbox | 2 | 60 分鐘後找人 |
| Agent 卡住 | Escalate 給人類 | — | 15 分鐘後 |
| PR approved + CI green | 通知 ready-to-merge | — | — |
設定寫在 .octo/reactions.conf,可以 per-project 客製。這個機制的哲學很明確:讓 agent 處理機械性的修復循環,只有真的卡住才打擾人。
安裝
Claude Code(推薦):
/plugin marketplace add https://github.com/nyldn/claude-octopus.git
/plugin install octo@nyldn-plugins
/octo:setup
不乾淨的話:
claude plugin uninstall octo
# 或加上 scope
claude plugin uninstall octo --scope project
也支援 Codex CLI、Cursor(走 MCP server)、OpenCode。Cursor 的 ~/.cursor/mcp.json:
{
"mcpServers": {
"claude-octopus": {
"command": "npx",
"args": ["tsx", "${userHome}/.cursor/claude-octopus/mcp-server/src/index.ts"],
"env": {
"OCTO_CLAW_ENABLED": "true",
"OPENAI_API_KEY": "${env:OPENAI_API_KEY}",
"GEMINI_API_KEY": "${env:GEMINI_API_KEY}"
}
}
}
}
跟其他 Claude Code 增強層比
| 層面 | Claude Octopus | oh-my-claudecode | 純 Claude Code |
|---|---|---|---|
| 核心抽象 | Consensus gate + multi-provider | 多 Agent 協作 + magic keyword | 單 Agent CLI |
| Provider | 最多 8 個(含 Copilot、Qwen、Ollama) | Claude + Codex + Gemini | 只有 Claude |
| 主要賣點 | 共識擋盲點、Dark Factory 全自動 | 跨模型省 token、rate limit 自動恢復 | 簡單、直接 |
| Persona | 32 個 | 19 個 | 無 |
| 安裝影響 | Plugin namespace 隔離 | 增強層 | — |
簡單說:Octopus 在意的是品質管控,OMC 在意的是協作效率,原生 Claude Code 在意的是可控性。如果你的痛點是「模型寫出來的東西看起來都對但上線就炸」,Octopus 的共識 gate 最直接。
適用情境
- Security 敏感的 PR:
/octo:security讓 Gemini + Perplexity 查 CVE、security-auditor persona 跑 OWASP checklist - 需求還沒定的新功能:
/octo:embrace從 discover 開始,讓多 provider 先吵出 spec 再動手 - 大量重複性 scaffolding:
/octo:factory配 semi-autonomous,交出一份 spec,回來看成果 - 多人 review 難排:Reaction Engine + 多 provider review,等於內建一支異步 review 團隊
不適合:
- 單純 one-shot 小改:共識開銷不划算,直接 Claude Code
- 完全 offline:除非只用 Ollama provider,否則共識價值打折
- 預算極敏感:八 provider 裡 Perplexity 和 OpenRouter 會算錢,Codex / Gemini 的 OAuth 額度也是有上限的
整體來說
Claude Octopus 把「多模型共識」從研究題目變成可以一行指令裝的 Claude Code plugin。32 persona + 48 slash command + 51 skill 規模上不算小,但 /octo:* 命名空間隔離讓它比想像中好裝拆。最有價值的設計不是指令數量,而是把共識門檻(75%)和 reaction 自動化(CI/review 閉環)當成預設——這兩點是純 Claude Code 目前沒有內建的。
想要把 Claude Code 從「單模型寫 code」升級成「多模型互審 + 有 delivery gate」,Octopus 是目前最完整的現成答案。