ArcReel 是什么?

ArcReel 是一个由 AI Agent 驱动的开源视频生成工作台,目标是把一部小说一路自动化地变成短视频:小说 → 全局角色/线索提取 → 分集规划 → 剧本 → 角色/场景/道具设计图 → 分镜图 → 视频片段 → FFmpeg 合成成片,并特别强调跨镜头的角色与场景一致性。它基于 Claude Agent SDK 编排多智能体协作,图像生成接 Gemini、火山方舟、Grok、OpenAI、Vidu,视频生成接 Veo 3.1、Seedance、Grok、Sora 2、Vidu Q3 等并可全局/项目级切换。技术栈为 Python 3.12 + FastAPI + React 19,提供可视化工作台与 Docker 部署,AGPL-3.0 开源。

⭐ 1,399 Stars 🍴 286 Forks Python AGPL-3.0 作者: ArcReel
来源:README 顶部简介、核心能力、工作流程、GitHub meta(ArcReel/ArcReel,Python,AGPL-3.0,homepage arc-reel.com) 查看 GitHub 仓库 →

为什么值得关注

AI 视频生成工具很多,但「把长篇小说自动改编成保持角色/场景一致的连续短视频」这条完整流水线少有人做扎实。ArcReel 用 AI Agent 编排把选题、拆分、设计、分镜、生成、合成串成一键工作流,又用「角色设计图 + 线索追踪」解决跨镜一致性这个最难的痛点,并支持多供应商图像/视频模型自由切换、导出剪映草稿。工程上还带沙箱化 agent 运行、异步任务队列、断点续传、SSE 实时追踪、测试/覆盖率/CodeQL 等设施。这套「完整、可自托管、可一致性产出」的定位使其受到关注(约 2,300 星,迭代活跃)。

来源:README 核心能力/功能特性、徽章(Tests/Coverage/CodeQL)、GitHub meta(stars 2313、created_at 2026-02-07、pushed_at 2026-05-23)

核心功能

AI Agent 驱动的端到端流水线

基于 Claude Agent SDK 编排:编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务(剧本、设计图、分镜、视频等)后返回摘要,自动跑完从小说到成片的完整流程。

来源:README 核心能力「AI Agent 工作流」、功能特性「多智能体架构」、工作流程图
跨镜一致性(角色/场景/道具)

先生成角色设计图与线索(道具/场景)设计图,再据此生成分镜与视频,用设计图锚定与线索追踪保证同一角色、道具、场景在不同镜头间保持连贯——这是小说改编视频最难的一环。

来源:README 顶部简介、核心能力「多供应商图像生成」、工作流程图
多供应商图像/视频/文本生成

图像接 Gemini、火山方舟、Grok、OpenAI、Vidu;视频接 Veo 3.1、Seedance、Grok、Sora 2、Vidu Q3 等,全局或项目级可切换;还可接入任意 OpenAI 兼容/Google 兼容 API(Ollama、vLLM、第三方中转),自动发现模型并分配媒体类型。

来源:README 核心能力「多供应商图像/视频生成」、功能特性「多供应商支持」「自定义供应商」
多种内容与视频生成模式

两种内容模式:说书模式按朗读节奏拆片段、剧集动画模式按场景/对话结构组织;三种视频生成模式:图生视频(分镜图驱动)、宫格生视频(grid_4/6/9 合成后拆作首尾帧)、参考生视频(直接用角色/场景/道具资产图生成、跳过分镜)。

来源:README 功能特性(两种内容模式、三种视频生成模式)
工程化运行与可视化工作台

Agent 工具调用默认在 bwrap 沙箱内按白名单授权文件/网络/子进程(Linux/macOS 自动启用,Windows 降级);异步任务队列带 RPM 限流、图像/视频独立并发通道、lease 调度与断点续传;Web 工作台管理项目、预览素材、版本回滚、SSE 实时任务追踪,并可导出剪映草稿。

来源:README 核心能力「异步任务队列」「可视化工作台」、功能特性「沙箱化 Agent 运行环境」、工作流程图(导出剪映草稿)

技术架构

ArcReel 是 Python 3.12 + FastAPI 后端、React 19 前端的全栈应用。后端在 server/ 与 lib/,用 Claude Agent SDK 编排多智能体:一个编排 Skill 检测项目状态并调度若干聚焦 Subagent,各自完成剧本/设计/分镜/视频任务;agent 工具调用跑在 bwrap 沙箱内按白名单授权(POSIX-only,Windows 自动降级)。任务由异步队列驱动(RPM 限流、图像/视频独立并发、lease 调度、断点续传),状态经 SSE 推给前端工作台。数据层用 SQLite(默认)或 PostgreSQL(生产),用 alembic 管理迁移。仓库还含 frontend/(React 工作台)、deploy/(Docker compose,默认与 production 两套)、agent_runtime_profile/、openspec/、vertex_keys/(Vertex AI 凭据)、scripts/、tests/、docs/、projects/(项目数据)。生成的视频由 FFmpeg 合成,并可导出剪映草稿。多供应商(图像/视频/文本)通过统一接口接入,支持自定义 OpenAI/Google 兼容端点。

来源:README 核心能力/功能特性/快速开始、仓库目录树(server/lib/frontend/deploy/alembic/tests/agent_runtime_profile/vertex_keys 等)、徽章(Python/React/FastAPI/Claude Agent SDK)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) Claude Agent SDK(Anthropic,编排)Claude Agent S… 图像:Gemini / 火山方舟 / Grok / OpenAI / Vidu图像:Gemini /… 视频:Veo 3.1 / Seedance / Grok / Sora 2 / Vidu Q3视频:Veo 3.1 /… FFmpeg(合成)、剪映草稿导出FFmpeg(合成)… bwrap(agent 沙箱)、alembic(迁移)bwrap(agent… AI Agent 驱动的端到端流水线AI Agent 驱动的端到… 跨镜一致性(角色/场景/道具)跨镜一致性(角色/场景… 多供应商图像/视频/文本生成多供应商图像/视频/文… 多种内容与视频生成模式 工程化运行与可视化工作台工程化运行与可视化工作… ArcReel 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python 3.12(后端)+ TypeScript/React 19(前端)框架FastAPI + Claude Agent SDK(多智能体编排)
Claude Agent SDK(Anthropic,编排)图像:Gemini / 火山方舟 / Grok / OpenAI / V…视频:Veo 3.1 / Seedance / Grok / Sora …FFmpeg(合成)、剪映草稿导出bwrap(agent 沙箱)、alembic(迁移)SQLite / PostgreSQL
Docker compose 部署(默认 SQLite,生产 PostgreSQL);推荐 Linux/macOS/WSL2/Docker;可选 Vertex AI 凭据;默认端口 1241
来源:README 徽章/快速开始/功能特性、仓库目录

快速上手

推荐在 Linux/macOS/WSL2/Docker 下运行(Windows 原生可跑基础流程,但 bwrap 等沙箱会降级)。默认部署(SQLite):`git clone https://github.com/ArcReel/ArcReel.git && cd ArcReel/deploy && cp .env.example .env && docker compose up -d`,访问 http://localhost:1241。生产部署(PostgreSQL):进入 deploy/production,配置 .env(需设 POSTGRES_PASSWORD)后 docker compose up -d。首次用默认账号 admin 登录(密码由 .env 的 AUTH_PASSWORD 设置或首次自动生成回写),到 /settings 配置:①ArcReel 智能体的供应商凭据(Anthropic 官方或兼容供应商、自定义 Base URL/模型);②至少一个生图/生视频/生文本供应商的 API Key(Gemini/火山方舟/Grok/OpenAI/Vidu)或自定义供应商。
来源:README 快速开始(默认/生产部署、首次配置)

使用场景

面向想把文字内容批量转成视频的创作者与团队:网络小说/故事改编成连续短视频或剧集动画、说书类内容自动配图配镜、用统一工作台管理多集项目并保持角色与场景一致;多供应商可按成本/效果自由切换,产出可导出到剪映继续精修。对开发者,它也是研究「用 Claude Agent SDK 编排多智能体跑长流程创意流水线」「跨镜一致性如何用设计图+线索追踪实现」的完整参考。注意生成内容应遵守各模型供应商条款与版权/肖像等法规。

来源:README 顶部简介、核心能力、功能特性

优势与局限

优势

  • 流水线完整且有针对性:从小说到成片一键编排,并用设计图+线索追踪专门解决跨镜角色/场景一致性这一核心难题。
  • 多供应商、可切换、可自定义:图像/视频/文本均支持五大预置供应商及任意兼容端点,避免被单一厂商锁定。
  • 工程扎实:bwrap 沙箱化 agent、异步队列+限流+断点续传、SSE 追踪、版本回滚,且有测试/覆盖率/CodeQL 等质量设施。
  • 部署友好、可自托管:Docker 一键起(SQLite/PostgreSQL 两套),AGPL-3.0 开源,并能导出剪映草稿衔接后期。

局限

  • AGPL-3.0 强 copyleft:作为网络服务对外提供需开放衍生源码,商用集成前需评估合规。
  • 成本与依赖:高质量成片要调用多家云端图像/视频模型,token 与生成费用可观,且依赖各供应商可用性与额度。
  • 平台限制:bwrap 等沙箱为 POSIX-only,Windows 原生会降级,生产建议 WSL2/Docker。
  • 生成质量与一致性仍受底层模型与提示影响,长篇改编需人机协作(如分集需用户确认断点),并非全自动产出成品。
来源:README 快速开始(OS 提示)、功能特性(沙箱/渐进式分集)、License(AGPL-3.0)、多供应商说明

最新版本

项目通过 GitHub Releases 发版并提供 ghcr.io Docker 镜像,迭代活跃(含 Tests/Coverage/CodeQL 工作流)。功能已覆盖小说到成片的完整流水线、跨镜一致性、多供应商图像/视频/文本、两种内容模式与三种视频生成模式、沙箱化 agent、异步队列与剪映导出。仓库最近一次更新在采集日当天(2026-05-23)。

来源:README 徽章(Release/Docker/Tests)、功能特性、GitHub meta pushed_at 2026-05-23

总结评价

ArcReel 是开源 AI 视频生成里少见地「把整条小说改编流水线做完整」的项目:AI Agent 编排从小说到成片,并用设计图+线索追踪正面解决跨镜角色/场景一致性这个最棘手的问题,多供应商可切换、工程设施(沙箱、队列、限流、追踪、测试)也相当到位,还能导出剪映继续精修。对做小说改编、说书或剧集动画的创作者和团队很有价值,也是研究多智能体长流程编排的好范例。需要权衡的是 AGPL 的商用约束、多家云模型带来的生成成本、对 POSIX/Docker 环境的偏好,以及长篇仍需人机协作而非全自动。作为可自托管、追求一致性产出的 AI 视频工作台,它的完整度和工程质量都很突出。

来源:综合 README、核心能力、功能特性与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 18:49. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件