#harness-engineering

10 篇文章

ai deep-dive 2026年6月20日

Loop Engineering：當 AI 不再需要你打 Prompt

Loop Engineering 是設計「自動 prompt agent 的系統」而非手動 prompt 的工程實踐。Boris Cherny 跑數百個 agent、Addy Osmani 正式命名、Blake Crosley 指出驗證成本才是真正瓶頸——這篇整理一手來源、五大構建塊、適用邊界與批評觀點。

#loop-engineering #ai-agent #claude-code #prompt-engineering #harness-engineering #agentic-coding

ai deep-dive 2026年5月10日

別人怎麼用 LLM 寫文章：從 Karpathy LLM-wiki 到多 agent pipeline 的取捨筆記

綜述 11 個公開的 LLM 寫作 pipeline，三條主流模式：多 agent（researcher → writer → critic）、Karpathy LLM-wiki（raw + wiki + LLM 寫不手寫）、品質防線（technical verifier + never fabricate + brief gate）。Princeton GEO 論文（KDD 2024）量化了 inline 引用 +28%、加數字 +33%、quote 原文 +41%、關鍵字塞詞 −9%。

#llm-writing #content-pipeline #claude-code #agent-skills #llm-wiki #geo #multi-agent #harness-engineering

ai guide 2026年4月21日

Codex App Server：OpenAI 如何把 Agent Harness 變成通用協議

OpenAI 把 Codex harness 包裝成 JSON-RPC over stdio 的 App Server，讓 VS Code、JetBrains、Web、桌面 App 都能共用同一套 agent loop，三個核心 primitive：Item、Turn、Thread。

#codex #app-server #json-rpc #agent-harness #openai #harness-engineering

ai guide AI Agent 實戰 2026年4月21日

OpenAI 用 Codex 寫了 100 萬行程式碼：Harness Engineering 實戰

OpenAI 內部團隊 5 個月、3 人、0 行手寫程式碼，用 Codex 交付了一個完整產品。這篇整理他們在 AGENTS.md 設計、repo-local 知識庫、架構強制執行、entropy 管理上的核心心得。

#harness-engineering #codex #openai #agent-first #agents-md #agentic-coding

product project 2026年4月18日

quidproquo 部落格改進完整規劃：從內容、技術、RAG 設計到 Harness 基礎建設

用自己寫的 30+ 篇 RAG/Agent 文章交叉檢視部落格現狀，整理出橫跨內容品質、網站技術、RAG 設計修正、Harness 基礎建設、AI Agent 應用的完整改進清單，按優先級排列、不分階段。

#quidproquo #rag #ai-agent #harness-engineering #context-engineering #blog #product-design

ai guide 2026年4月10日

Agent Skills：讓 AI 代理像資深工程師一樣工作的技能框架

Agent Skills 是 Addy Osmani 開源的 19 個生產級工程技能，透過 /spec → /plan → /build → /test → /review → /ship 的指令驅動 AI 代理遵循資深工程師的開發紀律，而不是走捷徑。

#agent-skills #ai-agent #harness-engineering #claude-code #cursor #gemini-cli #development-workflow

ai guide 2026年4月4日

Claude Code Agent Teams 怎麼用？從 GitHub 6,400+ 個 agent 看設計模式

GitHub 上已有 6,400+ 個 .claude/agents/*.md 檔案。我們拆解了 4 個代表性專案——ChemistryTimes（內容生產 pipeline）、claude-sub-agent（document-driven 開發流水線）、agentic（Temporal.io DAG 平行執行）、vs-copilot-multi-agent（Hook 強制記憶寫入）——加上 ruflo 的企業級 swarm 架構，歸納出 6 種設計模式和 5 個實戰趨勢。

#claude-code #agent-teams #subagent #multi-agent #orchestrator-pattern #ai-pipeline #context-engineering #harness-engineering #temporal #swarm #quality-gates

ai guide AI Agent 實戰 2026年3月30日