Script-to-Video Pipeline
腳本自動轉視頻流水線
給定一段戲劇腳本,自動生成帶有素材和語音的視頻初稿,全程無需人工介入。
📋 項目概述
這是 starsoup AI 內容生產基礎設施的核心組件,目標是實現「腳本輸入 → 視頻輸出」的全自動閉環。
設計目標:
- 最小成本 — AI 調用之外的每個環節優先免費或自托管
- 全自動閉環 — 無需人工干預
- 可延伸性 — 各節點可獨立替換供應商
- Harness 設計 — 明確的輸入/輸出格式約束
🏗️ 系統架構
[腳本輸入] → [場景解析] → [素材匹配] → [語音合成] → [視頻合成] → [輸出通知]流水線節點:
- 結構化場景解析 — AI 提取場景、角色、動作、對白
- 素材匹配 — 根據描述匹配圖片/視頻素材
- 語音合成 — TTS 生成角色語音
- 視頻合成 — 自動剪輯、配樂、字幕
- 輸出通知 — 完成後通知用戶
📚 文檔目錄
需求與規劃
- Script-to-Video PRD — 需求文檔與系統架構