OpenMontage 自称「首个开源的、Agentic 的视频制作系统」:它把你的 AI 编码助手(Claude Code、Cursor、Copilot、Windsurf、Codex 等)变成一个完整的视频制作工作室。你用自然语言描述想要的视频,agent 负责调研、写脚本、生成素材、剪辑到最终合成。它既能做「图生视频」类的动画,也能做真正的「实拍视频」——从免费素材库与开放档案建语料、检索真实运动镜头、剪进时间线并渲染成片,而不只是把几张静帧动起来。技术上用 Python + FFmpeg + Remotion,附 13 条流水线、100+ 工具与上百个 agent 技能,接入 Veo/Kling/FLUX/gpt-image/ElevenLabs/WhisperX 等多家服务,AGPL-3.0 开源。
来源:README 顶部简介与「Important distinction」、Quick Start、pipeline_defs/tools/skills 目录、GitHub meta(calesthio/OpenMontage,Python,AGPL-3.0) 查看 GitHub 仓库 →AI 视频工具大多是「网页里点一点生成几秒片段」,而把完整制作流程(调研→脚本→素材→剪辑→合成)交给「你已经在用的编码助手」来跑、还能成本透明地复现,是新颖且实用的角度。OpenMontage 用一系列带完整 prompt、流水线、所用工具与成本(如 $0.15–$1.33)的成片示例(科幻预告、皮克斯风短片、吉卜力风动画、产品广告等)证明可行,并能从一段参考视频(YouTube/TikTok)反推出制作方案,传播力强。AGPL 开源、支持多编码助手与多供应商,使它累计约 3,900 星。
来源:README 示例视频与成本、Start From A Video、GitHub meta(stars 3921、created_at 2026-03-29)用自然语言描述需求,AI 编码助手驱动 OpenMontage 完成调研、脚本、分镜、素材生成、剪辑与最终合成全流程,产出可直接发布的成片。支持 Claude Code、Cursor、Copilot、Windsurf、Codex 等任意能读文件、跑代码的助手。
来源:README 顶部简介、Quick Start(works with…)除图生视频外,可走「真·实拍」路径:agent 从免费素材库与开放档案构建语料、检索真实运动镜头、剪进时间线并渲染成片,区别于「把几张静图动起来当视频」的做法。
来源:README「Important distinction」、Start From A Video内置 animated-explainer、animation、cinematic、documentary-montage、character-animation、avatar-spokesperson、talking-head、clip-factory、podcast-repurpose、localization-dub、screen-demo、hybrid 等十余条流水线,配 100+ 工具与上百个 agent 技能,覆盖解说、纪录片蒙太奇、角色动画、配音本地化、播客重剪等多种成片类型。
来源:README 顶部简介、pipeline_defs/ 目录(13 个 yaml)、tools/skills 目录可从 YouTube/Short/Reel/TikTok 或本地片段出发:agent 分析其转写、节奏、场景、关键帧与风格,给出 2–3 个差异化概念、诚实的工具路径、成本估算与样片,再进入完整制作;明确告诉你「保留什么、改变什么、花多少、最终长什么样」。
来源:README「Start From A Video You Already Love」段接入 Veo、Kling(via fal.ai)、FLUX、gpt-image-1、ElevenLabs/Chirp3-HD TTS、WhisperX(字级字幕)等,并用 Remotion 做合成与动效;每个示例都标注用到的流水线、工具与实际花费,强调可复现、可只用单一 API key 起步。
来源:README 各示例(模型/成本)、docs/PROVIDERS.md 链接OpenMontage 是 Python 编排 + Remotion 合成的 agentic 视频制作框架。仓库按职能组织:pipeline_defs/(13 条 YAML 流水线定义,描述各类成片的步骤)、tools/(100+ 工具,封装素材生成/检索/处理等原子能力)、skills/(上百个 agent 技能)、remotion-composer/(基于 Remotion 的最终合成与动效引擎)、lib/、schemas/、styles/、docs/、tests/,并为多编码助手准备了 .claude/.cursor/.agents 适配目录。运行时,用户在 AI 编码助手里下达自然语言需求,agent 选择/编排流水线、调用工具生成或检索素材(图像、运动镜头、TTS、字幕、音乐),用 FFmpeg 处理、Remotion 合成并渲染成片。素材来源既可走多家生成 API(Veo/Kling/FLUX/gpt-image/ElevenLabs 等),也可走免费素材库与开放档案的真实镜头检索。依赖 Python 3.10+、FFmpeg、Node.js 18+。
来源:仓库目录树(pipeline_defs/tools/skills/remotion-composer/lib/schemas)、README How It Works/Quick Start、Prerequisites中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
FFmpeg(媒体处理)、Node.js 18+、Remotion图像/视频:FLUX、gpt-image-1、Veo、Kling(fal…语音/字幕:ElevenLabs / Chirp3-HD TTS、Whi…宿主:Claude Code/Cursor/Copilot/Windsu…适合想用 AI 编码助手批量产出视频的创作者、营销与独立开发者:做动画解说、产品广告、科幻/动画短片、纪录片蒙太奇、口播/虚拟主播、播客重剪、本地化配音、屏幕演示等;既可纯生成素材,也可检索真实镜头做实拍风格;还能从一段喜欢的参考视频出发快速复刻同类风格。成本透明、可复现,适合预算敏感、想把制作流程自动化的人。也是研究「如何用 agent + 流水线 + Remotion 把视频制作端到端自动化」的参考实现。注意生成内容需遵守各供应商条款与版权/素材授权。
来源:README 示例/Pipelines/Try These Prompts/Start From A Video项目以仓库形式迭代,README 标注 12+ 流水线、52+ 工具、500+ agent 技能(仓库内 pipeline_defs 13 个、tools/skills 数量随版本增长),并持续在 YouTube 发布带完整 prompt/流水线/工具/成本的可复现成片。AGPL-3.0 开源。最近一次更新在 2026-05-07。
来源:README 顶部简介/Follow The Build、仓库目录、GitHub meta pushed_at 2026-05-07、created_at 2026-03-29OpenMontage 把「用 AI 做视频」从网页点按生成几秒片段,升级成「让你已在用的编码助手跑完整制作流水线」:自然语言下单,agent 调研、写本、生成或检索素材、剪辑并用 Remotion 合成成片,还能做真实镜头的实拍路径、从参考视频反推方案,且每个示例都成本透明可复现。对想自动化、低成本批量产视频的创作者和开发者很有吸引力,工程完成度也高。要权衡的是 AGPL 的商用约束、Python/FFmpeg/Node 与多家付费 API 的依赖与成本,以及自动化产出仍需人工把关质量与素材授权。作为开源 agentic 视频制作系统,它的思路和完整度都相当突出。
来源:综合 README、流水线/工具、示例与 GitHub meta 的事实判断