AI 影片工具在 2025 年底到 2026 年初迎來一個重要轉折:從「你去用工具」變成「工具被 agent 呼叫」。
你不再需要開啟 HeyGen 網頁、手動選 avatar、貼腳本、等渲染、下載、分享。整個流程可以濃縮成一句對 Claude 說的話。這篇文章介紹目前最主流的三種整合方式,以及各工具適合搭配哪個 agent。
整體架構
你的指令
↓
AI Agent(Claude Code / Cursor / Codex / Gemini CLI)
↓ ↓
Skills / MCP 直接 API
↓ ↓
HyperFrames HeyGen Runway Synthesia
↓
輸出影片
整合方式分三種,從上到下設定成本遞增、彈性也遞增:
- Skills — 讓 agent 學會工具的使用方式,一行指令安裝
- MCP Connector — 讓 agent 直接呼叫服務 API,適合非技術用戶
- API 直接整合 — 最靈活,適合開發者自建流水線
Skills:最快的起點(HyperFrames)
Skills 是一種「知識包」,告訴 agent 如何正確使用某個工具的 API pattern。安裝後,agent 就不需要從零摸索文件。
支援工具: Claude Code、Cursor、Codex、Gemini CLI
HyperFrames 是 HeyGen 開源的影片生成框架(Apache 2.0),核心概念是「影片即程式碼」:用 HTML/CSS/GSAP 描述場景結構,agent 生成組合檔,最後 CLI 渲染成 MP4。
# 安裝 HyperFrames skill
npx skills add heygen-com/hyperframes
# 初始化專案
npx hyperframes init my-promo
在 Claude Code 裡:
/hyperframes Create a 10-second product intro video.
Visual style: high-tech, ivory background.
Content: based on @product.pdf
Include: fade-in title, feature highlights, ambient music
# 即時預覽
npx hyperframes preview
# 渲染輸出
npx hyperframes render --output final.mp4
之後可以像跟剪輯師說話一樣迭代:
Make the title 30% bigger
Add a lower-third at 0:03 saying "Launch Special"
Switch background to dark mode
Add a zoom-in transition between scene 2 and 3
HyperFrames 的核心優勢是 deterministic:相同輸入永遠產生相同輸出,適合批次生產和版本控制。HTML 也是 LLM 最熟悉的語言,比 React 組件的 lifecycle 問題少很多。
MCP Connector:無程式碼整合(HeyGen)
MCP(Model Context Protocol)讓 agent 可以直接呼叫外部服務,不需要手動切換工具或複製貼上。
支援工具: Claude.ai、Claude Desktop、Claude Code、Cursor
Claude.ai(最簡單)
- Claude.ai →
+→ Connectors → Add HeyGen - OAuth 授權,不需要 API key
- 在對話框輸入需求:
製作一部 45 秒的英文說明影片,介紹產品新功能。
使用商務風格男性 avatar,加上字幕。
腳本重點:痛點 → 解決方案 → call to action
Claude 會:寫腳本 → 呼叫 HeyGen API → 監控渲染進度 → 回傳分享連結,全在同一個對話完成。
Claude Code(批次自動化)
export HEYGEN_API_KEY=your_key
npx skills add heygen-com/skills
Generate 5 personalized sales videos for leads in leads.csv.
Each video: 30 seconds, avatar "Sarah_v2"
Dynamic variables: {{name}}, {{company}}
Output: share links in results.csv
這個模式適合業務自動化:讀 CRM 匯出的名單,逐筆生成個人化影片,輸出分享連結,不需要任何手動操作。
API 直接整合:最大彈性(Runway / Synthesia)
對於 Runway 和 Synthesia 這類沒有官方 MCP 的工具,可以讓 agent 直接操作 REST API。
Runway
MCP Market 上有社群維護的 Runway skill:
npx skills add runway-video-generation
或者讓 Claude Code 寫一個 API wrapper:
Write a Runway Gen-3 API client that:
- Takes a text prompt and optional reference image
- Generates a 10-second video clip
- Polls for completion and returns the download URL
Store API key in RUNWAY_API_KEY env var
Runway 的強項是風格控制和創意感,適合廣告創意或帶有電影感的短片,跟 HyperFrames 的工整排版風格是兩個不同的定位。
Synthesia
Synthesia 適合企業培訓影片,API 直接整合:
Use Synthesia API to create a training video:
- Script: @training-script.md
- Avatar: anna_costume1_cameraA
- Language: zh-TW
- Background: office_2
Return the video URL when done
各工具整合對照表
| Claude Code | Claude.ai | Cursor | Codex | |
|---|---|---|---|---|
| HyperFrames | ✅ Skill | ❌ | ✅ Skill | ✅ Skill |
| HeyGen | ✅ Skill + MCP | ✅ Connector | ✅ MCP | ✅ Skill |
| Runway | ✅ Skill / API | 🔶 API | ✅ API | ✅ API |
| Synthesia | 🔶 API | 🔶 API | 🔶 API | 🔶 API |
怎麼選
快速出片、不想寫程式 → Claude.ai + HeyGen Connector。描述需求,直接拿連結。
可程式化的影片流水線 → Claude Code + HyperFrames Skill。影片像程式碼一樣版控、批次生成、CI 可跑。
創意感強的廣告影片 → Claude Code + Runway API。提示詞控制風格,agent 處理 API 呼叫。
批次個人化影片(業務 / 行銷自動化) → Claude Code + HeyGen Skill。讀名單 → 批次生成 → 輸出連結,全自動。
整體來說
這波整合最重要的轉變不是工具變強了,而是工具從目的地變成工具箱。你不需要學 HeyGen 的介面,不需要學 HyperFrames 的 HTML 結構,只需要知道「我要什麼」,agent 負責翻譯成正確的 API 呼叫。
對開發者來說,HyperFrames + Claude Code 的組合最值得投入,因為影片的結構是可測試、可版控、可批次的。對行銷人來說,HeyGen MCP 是最低阻力的起點,設定一次之後就消失在背景裡。
參考資料
Loading...