OpenMontage 是什么?

OpenMontage 自称「首个开源的、Agentic 的视频制作系统」:它把你的 AI 编码助手(Claude Code、Cursor、Copilot、Windsurf、Codex 等)变成一个完整的视频制作工作室。你用自然语言描述想要的视频,agent 负责调研、写脚本、生成素材、剪辑到最终合成。它既能做「图生视频」类的动画,也能做真正的「实拍视频」——从免费素材库与开放档案建语料、检索真实运动镜头、剪进时间线并渲染成片,而不只是把几张静帧动起来。技术上用 Python + FFmpeg + Remotion,附 13 条流水线、100+ 工具与上百个 agent 技能,接入 Veo/Kling/FLUX/gpt-image/ElevenLabs/WhisperX 等多家服务,AGPL-3.0 开源。

⭐ 2,999 Stars 🍴 581 Forks Python 作者: calesthio
来源:README 顶部简介与「Important distinction」、Quick Start、pipeline_defs/tools/skills 目录、GitHub meta(calesthio/OpenMontage,Python,AGPL-3.0) 查看 GitHub 仓库 →

为什么值得关注

AI 视频工具大多是「网页里点一点生成几秒片段」,而把完整制作流程(调研→脚本→素材→剪辑→合成)交给「你已经在用的编码助手」来跑、还能成本透明地复现,是新颖且实用的角度。OpenMontage 用一系列带完整 prompt、流水线、所用工具与成本(如 $0.15–$1.33)的成片示例(科幻预告、皮克斯风短片、吉卜力风动画、产品广告等)证明可行,并能从一段参考视频(YouTube/TikTok)反推出制作方案,传播力强。AGPL 开源、支持多编码助手与多供应商,使它累计约 3,900 星。

来源:README 示例视频与成本、Start From A Video、GitHub meta(stars 3921、created_at 2026-03-29)

核心功能

Agentic 端到端视频制作

用自然语言描述需求,AI 编码助手驱动 OpenMontage 完成调研、脚本、分镜、素材生成、剪辑与最终合成全流程,产出可直接发布的成片。支持 Claude Code、Cursor、Copilot、Windsurf、Codex 等任意能读文件、跑代码的助手。

来源:README 顶部简介、Quick Start(works with…)
真实素材视频,而非只动静帧

除图生视频外,可走「真·实拍」路径:agent 从免费素材库与开放档案构建语料、检索真实运动镜头、剪进时间线并渲染成片,区别于「把几张静图动起来当视频」的做法。

来源:README「Important distinction」、Start From A Video
13 条流水线与海量工具/技能

内置 animated-explainer、animation、cinematic、documentary-montage、character-animation、avatar-spokesperson、talking-head、clip-factory、podcast-repurpose、localization-dub、screen-demo、hybrid 等十余条流水线,配 100+ 工具与上百个 agent 技能,覆盖解说、纪录片蒙太奇、角色动画、配音本地化、播客重剪等多种成片类型。

来源:README 顶部简介、pipeline_defs/ 目录(13 个 yaml)、tools/skills 目录
从参考视频反推制作方案

可从 YouTube/Short/Reel/TikTok 或本地片段出发:agent 分析其转写、节奏、场景、关键帧与风格,给出 2–3 个差异化概念、诚实的工具路径、成本估算与样片,再进入完整制作;明确告诉你「保留什么、改变什么、花多少、最终长什么样」。

来源:README「Start From A Video You Already Love」段
多供应商与成本透明

接入 Veo、Kling(via fal.ai)、FLUX、gpt-image-1、ElevenLabs/Chirp3-HD TTS、WhisperX(字级字幕)等,并用 Remotion 做合成与动效;每个示例都标注用到的流水线、工具与实际花费,强调可复现、可只用单一 API key 起步。

来源:README 各示例(模型/成本)、docs/PROVIDERS.md 链接

技术架构

OpenMontage 是 Python 编排 + Remotion 合成的 agentic 视频制作框架。仓库按职能组织:pipeline_defs/(13 条 YAML 流水线定义,描述各类成片的步骤)、tools/(100+ 工具,封装素材生成/检索/处理等原子能力)、skills/(上百个 agent 技能)、remotion-composer/(基于 Remotion 的最终合成与动效引擎)、lib/、schemas/、styles/、docs/、tests/,并为多编码助手准备了 .claude/.cursor/.agents 适配目录。运行时,用户在 AI 编码助手里下达自然语言需求,agent 选择/编排流水线、调用工具生成或检索素材(图像、运动镜头、TTS、字幕、音乐),用 FFmpeg 处理、Remotion 合成并渲染成片。素材来源既可走多家生成 API(Veo/Kling/FLUX/gpt-image/ElevenLabs 等),也可走免费素材库与开放档案的真实镜头检索。依赖 Python 3.10+、FFmpeg、Node.js 18+。

来源:仓库目录树(pipeline_defs/tools/skills/remotion-composer/lib/schemas)、README How It Works/Quick Start、Prerequisites

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) FFmpeg(媒体处理)、Node.js 18+、RemotionFFmpeg(媒体处… 图像/视频:FLUX、gpt-image-1、Veo、Kling(fal.ai)图像/视频:FLUX… 语音/字幕:ElevenLabs / Chirp3-HD TTS、WhisperX语音/字幕:Elev… 宿主:Claude Code/Cursor/Copilot/Windsurf/Codex宿主:Claude Co… Agentic 端到端视频制作 真实素材视频,而非只动静帧真实素材视频,而非只动… 13 条流水线与海量工具/技能13 条流水线与海量工具… 从参考视频反推制作方案 多供应商与成本透明 OpenMontage 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python(编排)+ TypeScript(Remotion 合成)框架Agentic 流水线框架 + Remotion(合成/动效)
FFmpeg(媒体处理)、Node.js 18+、Remotion图像/视频:FLUX、gpt-image-1、Veo、Kling(fal…语音/字幕:ElevenLabs / Chirp3-HD TTS、Whi…宿主:Claude Code/Cursor/Copilot/Windsu…
本地运行(make setup),需 Python 3.10+/FFmpeg/Node 18+;多供应商按需配 API key,可只用单一 key 起步
来源:README Prerequisites/Quick Start/示例、docs/PROVIDERS.md

快速上手

前置:Python 3.10+、FFmpeg(brew/apt 装)、Node.js 18+,以及一个 AI 编码助手(Claude Code/Cursor/Copilot/Windsurf/Codex)。安装:`git clone https://github.com/calesthio/OpenMontage.git && cd OpenMontage && make setup`。然后在编码助手里打开项目并用自然语言下指令,例如「做一个 60 秒讲神经网络如何学习的动画解说」,或走实拍路径「做一段 75 秒关于雨中城市生活的纪录片蒙太奇,只用真实素材、不要旁白、挽歌基调、配乐」。也可粘贴一段参考视频让它分析后给出概念、成本与样片再制作。按需配置各供应商 API key(可只用一个起步)。
来源:README Quick Start/Try These Prompts/Start From A Video

使用场景

适合想用 AI 编码助手批量产出视频的创作者、营销与独立开发者:做动画解说、产品广告、科幻/动画短片、纪录片蒙太奇、口播/虚拟主播、播客重剪、本地化配音、屏幕演示等;既可纯生成素材,也可检索真实镜头做实拍风格;还能从一段喜欢的参考视频出发快速复刻同类风格。成本透明、可复现,适合预算敏感、想把制作流程自动化的人。也是研究「如何用 agent + 流水线 + Remotion 把视频制作端到端自动化」的参考实现。注意生成内容需遵守各供应商条款与版权/素材授权。

来源:README 示例/Pipelines/Try These Prompts/Start From A Video

优势与局限

优势

  • 把完整视频制作流程(调研→脚本→素材→剪辑→合成)交给你已在用的编码助手,自然语言驱动、端到端自动化。
  • 覆盖面广且不止于动静帧:13 条流水线、100+ 工具、上百技能,并能做真实素材检索与剪辑的实拍路径。
  • 成本透明、可复现:示例都标注流水线/工具/花费($0.15–$1.33),可只用单一 API key 起步,门槛低。
  • 用 Remotion 做合成与动效、支持从参考视频反推方案,工程化与实用性兼顾,AGPL 开源。

局限

  • AGPL-3.0 强 copyleft:作为服务对外提供需开放衍生源码,商用集成前需评估合规。
  • 环境与依赖较重:需 Python/FFmpeg/Node/Remotion 与编码助手,且高质量成片要调用多家付费生成 API、成本随时长上升。
  • 产出质量与一致性受底层模型/素材与提示影响,复杂项目仍需人工把关,自动化≠成品保证。
  • 真实素材路径依赖免费库/开放档案的可得性与授权,使用需注意版权与各供应商条款。
来源:README 示例/Important distinction/Prerequisites、License(AGPL-3.0)

最新版本

项目以仓库形式迭代,README 标注 12+ 流水线、52+ 工具、500+ agent 技能(仓库内 pipeline_defs 13 个、tools/skills 数量随版本增长),并持续在 YouTube 发布带完整 prompt/流水线/工具/成本的可复现成片。AGPL-3.0 开源。最近一次更新在 2026-05-07。

来源:README 顶部简介/Follow The Build、仓库目录、GitHub meta pushed_at 2026-05-07、created_at 2026-03-29

总结评价

OpenMontage 把「用 AI 做视频」从网页点按生成几秒片段,升级成「让你已在用的编码助手跑完整制作流水线」:自然语言下单,agent 调研、写本、生成或检索素材、剪辑并用 Remotion 合成成片,还能做真实镜头的实拍路径、从参考视频反推方案,且每个示例都成本透明可复现。对想自动化、低成本批量产视频的创作者和开发者很有吸引力,工程完成度也高。要权衡的是 AGPL 的商用约束、Python/FFmpeg/Node 与多家付费 API 的依赖与成本,以及自动化产出仍需人工把关质量与素材授权。作为开源 agentic 视频制作系统,它的思路和完整度都相当突出。

来源:综合 README、流水线/工具、示例与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 19:11. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件