Skip to content

Claude Octopus:把 8 個模型同時掛在 Claude Code 上的共識 Plugin

2026年4月14日 1 分鐘
TL;DR Claude Octopus 是一個 Claude Code plugin,能同時叫 Codex、Gemini、Copilot、Qwen、Ollama、Perplexity、OpenRouter 和 Claude 一起看同一份 code,用 75% 共識門檻找單模型的盲點。內建 32 個 persona、48 個 /octo:* slash commands、51 個 skill、以及 Dark Factory 全自動 spec-to-code 管線。

單一模型會有盲點,這件事所有用過 agentic coding 的人都同意。Claude Octopus 是 nyldn 做的 Claude Code plugin,核心想法很直接:一次把最多 8 個模型掛在同一個任務上,彼此互審,意見不合就擋下來。這篇整理它的架構、指令、persona 系統、以及和其他 Claude Code 增強層(例如 oh-my-claudecode)相比的差異。

定位:不是另一個 agent,是一層共識閘門

Octopus 在 Claude Code 裡是一個 plugin,不是 fork 也不是 wrapper。它只佔用 /octo:* 這個 namespace 和自然語言前綴 octo,其他 Claude Code 行為完全不動。這個設計很重要——你可以裝起來試,不滿意一行指令就乾淨卸載,沒有殘留設定。

它要解決的問題不是「自動寫更多 code」,而是「在 ship 之前,讓另外 7 個模型先罵一輪」。Octopus 把 consensus gate 當成第一原則:預設 75% 的 provider 要同意,工作才能過 gate,否則整條管線就停下來給人看。

八個 tentacle:多 provider 協作

預設支援的 provider 有八種,每個角色不同:

Provider角色認證方式費用
ClaudeOrchestration、synthesisClaude Code 內建依 Claude 訂閱
Codex (OpenAI)Implementation、code pattern 深度codex loginOPENAI_API_KEYOAuth 免費或 per-token
Gemini (Google)生態廣度、security reviewGoogle OAuth 或 GEMINI_API_KEYOAuth 免費或 per-token
Copilot (GitHub)Research 零成本跑腿沿用 GitHub 訂閱免費
Qwen (Alibaba)Research tierQwen OAuth每日 1,000–2,000 次免費
Ollama本地、離線、隱私敏感任務本地安裝免費
PerplexityLive web search、CVE 查詢API key依 API
OpenRouter100+ 模型 routingAPI key依模型

重點是零 provider 也能跑——只有 Claude 的話 Octopus 就退化成有 persona 和 slash command 的單模型 harness。每加一個 provider 就自動偵測啟用,不用手動配 pipeline。

Double Diamond 四階段

Octopus 把 UK Design Council 的 Double Diamond 方法論直接搬到 coding agent 上,分四個階段:

階段指令做什麼
Discover/octo:discover多 AI 研究、探索問題空間
Define/octo:define用共識釐清需求、寫 spec
Develop/octo:develop開始實作、帶 quality gate
Deliver/octo:deliverAdversarial review + go/no-go 打分

你可以單獨呼叫任一階段,也可以 /octo:embrace 一次跑完整條管線。相較於「直接丟一句 prompt 給 Claude 寫 code」,這套流程的差別是定義階段先讓多模型吵架——spec 寫清楚再進到 develop,省掉 80% 的「做完才發現需求理解錯」。

八隻核心觸手(Primary Commands)

/octo:embrace       # 整條 lifecycle:research → define → develop → deliver
/octo:factory       # Autonomous spec-to-software(Dark Factory)
/octo:debate        # 四 AI 結構化辯論 + 共識
/octo:research      # 三 provider 多源綜合
/octo:design        # UI/UX 設計(含 BM25 retrieval)
/octo:tdd           # Red-green-refactor 紀律
/octo:security      # OWASP 漏洞掃描 + 修復
/octo:prd           # AI-optimized 產品需求文件

加上 review / debug / extract / docs / schedule / parallel / sentinel / optimize / brainstorm / doctor / quick 等延伸指令,整個 plugin 有 48 個 slash command。想偷懶就用 smart router:

/octo:auto <description>

它會解析自然語言意圖,自己選要跑哪條 workflow。

32 個 persona:context-aware agent

Octopus 預先定義了 32 個特化角色,根據 request 自動套用:

  • Software Engineering(11):backend-architect、frontend-architect、fullstack-engineer、devops-engineer、security-auditor、performance-optimizer、testing-strategist、database-specialist、api-designer、integration-engineer、systems-engineer
  • Specialized Development(6):mobile-engineer、ml-engineer、data-engineer、blockchain-engineer、iot-engineer、game-developer
  • Documentation / Communication(5):technical-writer、product-manager、business-analyst、ux-writer、content-strategist
  • Research / Strategy(3):researcher、strategist、analyst
  • Business / Compliance(3):compliance-officer、financial-analyst、legal-advisor
  • Creative / Design(4):ui-ux-designer、graphic-designer、creative-director、brand-strategist

一個「review 這支 API」的 request 可能同時觸發 api-designer + security-auditor + performance-optimizer,每個 persona 用不同 provider 回一份審查,最後在 consensus gate 收斂。

Dark Factory:給 spec 就走到底

Dark Factory 是最激進的模式——把一份 spec 丟進去,Octopus 完全自動跑完 Discover → Define → Develop → Deliver,中間不問人:

/octo:factory "build a CLI that converts CSV to JSON"

有三個 autonomy level:

  • Supervised:每個 phase 都要人工 approve
  • Semi-autonomous:只有失敗才介入
  • Autonomous:整條跑完才回頭看

搭配 git worktree 做 workstream isolation,可以讓多個並行任務在各自 branch 跑,最後自動 merge、處理衝突。

Reaction Engine:自動回應 lifecycle 事件

這是我覺得最「team-aware」的設計。Reaction Engine 監聽 CI、review、PR 的狀態變化,自動回應:

事件動作最大重試Escalation
CI failure收 log 丟 agent inbox330 分鐘後找人
Changes requested收 review comment 丟 inbox260 分鐘後找人
Agent 卡住Escalate 給人類15 分鐘後
PR approved + CI green通知 ready-to-merge

設定寫在 .octo/reactions.conf,可以 per-project 客製。這個機制的哲學很明確:讓 agent 處理機械性的修復循環,只有真的卡住才打擾人

安裝

Claude Code(推薦):

/plugin marketplace add https://github.com/nyldn/claude-octopus.git
/plugin install octo@nyldn-plugins
/octo:setup

不乾淨的話:

claude plugin uninstall octo
# 或加上 scope
claude plugin uninstall octo --scope project

也支援 Codex CLI、Cursor(走 MCP server)、OpenCode。Cursor 的 ~/.cursor/mcp.json

{
  "mcpServers": {
    "claude-octopus": {
      "command": "npx",
      "args": ["tsx", "${userHome}/.cursor/claude-octopus/mcp-server/src/index.ts"],
      "env": {
        "OCTO_CLAW_ENABLED": "true",
        "OPENAI_API_KEY": "${env:OPENAI_API_KEY}",
        "GEMINI_API_KEY": "${env:GEMINI_API_KEY}"
      }
    }
  }
}

跟其他 Claude Code 增強層比

層面Claude Octopusoh-my-claudecode純 Claude Code
核心抽象Consensus gate + multi-provider多 Agent 協作 + magic keyword單 Agent CLI
Provider最多 8 個(含 Copilot、Qwen、Ollama)Claude + Codex + Gemini只有 Claude
主要賣點共識擋盲點、Dark Factory 全自動跨模型省 token、rate limit 自動恢復簡單、直接
Persona32 個19 個
安裝影響Plugin namespace 隔離增強層

簡單說:Octopus 在意的是品質管控,OMC 在意的是協作效率,原生 Claude Code 在意的是可控性。如果你的痛點是「模型寫出來的東西看起來都對但上線就炸」,Octopus 的共識 gate 最直接。

適用情境

  • Security 敏感的 PR/octo:security 讓 Gemini + Perplexity 查 CVE、security-auditor persona 跑 OWASP checklist
  • 需求還沒定的新功能/octo:embrace 從 discover 開始,讓多 provider 先吵出 spec 再動手
  • 大量重複性 scaffolding/octo:factory 配 semi-autonomous,交出一份 spec,回來看成果
  • 多人 review 難排:Reaction Engine + 多 provider review,等於內建一支異步 review 團隊

不適合:

  • 單純 one-shot 小改:共識開銷不划算,直接 Claude Code
  • 完全 offline:除非只用 Ollama provider,否則共識價值打折
  • 預算極敏感:八 provider 裡 Perplexity 和 OpenRouter 會算錢,Codex / Gemini 的 OAuth 額度也是有上限的

整體來說

Claude Octopus 把「多模型共識」從研究題目變成可以一行指令裝的 Claude Code plugin。32 persona + 48 slash command + 51 skill 規模上不算小,但 /octo:* 命名空間隔離讓它比想像中好裝拆。最有價值的設計不是指令數量,而是把共識門檻(75%)和 reaction 自動化(CI/review 閉環)當成預設——這兩點是純 Claude Code 目前沒有內建的。

想要把 Claude Code 從「單模型寫 code」升級成「多模型互審 + 有 delivery gate」,Octopus 是目前最完整的現成答案。

參考資料