ArcReel 是一个由 AI Agent 驱动的开源视频生成工作台,目标是把一部小说一路自动化地变成短视频:小说 → 全局角色/线索提取 → 分集规划 → 剧本 → 角色/场景/道具设计图 → 分镜图 → 视频片段 → FFmpeg 合成成片,并特别强调跨镜头的角色与场景一致性。它基于 Claude Agent SDK 编排多智能体协作,图像生成接 Gemini、火山方舟、Grok、OpenAI、Vidu,视频生成接 Veo 3.1、Seedance、Grok、Sora 2、Vidu Q3 等并可全局/项目级切换。技术栈为 Python 3.12 + FastAPI + React 19,提供可视化工作台与 Docker 部署,AGPL-3.0 开源。
来源:README 顶部简介、核心能力、工作流程、GitHub meta(ArcReel/ArcReel,Python,AGPL-3.0,homepage arc-reel.com) 查看 GitHub 仓库 →AI 视频生成工具很多,但「把长篇小说自动改编成保持角色/场景一致的连续短视频」这条完整流水线少有人做扎实。ArcReel 用 AI Agent 编排把选题、拆分、设计、分镜、生成、合成串成一键工作流,又用「角色设计图 + 线索追踪」解决跨镜一致性这个最难的痛点,并支持多供应商图像/视频模型自由切换、导出剪映草稿。工程上还带沙箱化 agent 运行、异步任务队列、断点续传、SSE 实时追踪、测试/覆盖率/CodeQL 等设施。这套「完整、可自托管、可一致性产出」的定位使其受到关注(约 2,300 星,迭代活跃)。
来源:README 核心能力/功能特性、徽章(Tests/Coverage/CodeQL)、GitHub meta(stars 2313、created_at 2026-02-07、pushed_at 2026-05-23)基于 Claude Agent SDK 编排:编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务(剧本、设计图、分镜、视频等)后返回摘要,自动跑完从小说到成片的完整流程。
来源:README 核心能力「AI Agent 工作流」、功能特性「多智能体架构」、工作流程图先生成角色设计图与线索(道具/场景)设计图,再据此生成分镜与视频,用设计图锚定与线索追踪保证同一角色、道具、场景在不同镜头间保持连贯——这是小说改编视频最难的一环。
来源:README 顶部简介、核心能力「多供应商图像生成」、工作流程图图像接 Gemini、火山方舟、Grok、OpenAI、Vidu;视频接 Veo 3.1、Seedance、Grok、Sora 2、Vidu Q3 等,全局或项目级可切换;还可接入任意 OpenAI 兼容/Google 兼容 API(Ollama、vLLM、第三方中转),自动发现模型并分配媒体类型。
来源:README 核心能力「多供应商图像/视频生成」、功能特性「多供应商支持」「自定义供应商」两种内容模式:说书模式按朗读节奏拆片段、剧集动画模式按场景/对话结构组织;三种视频生成模式:图生视频(分镜图驱动)、宫格生视频(grid_4/6/9 合成后拆作首尾帧)、参考生视频(直接用角色/场景/道具资产图生成、跳过分镜)。
来源:README 功能特性(两种内容模式、三种视频生成模式)Agent 工具调用默认在 bwrap 沙箱内按白名单授权文件/网络/子进程(Linux/macOS 自动启用,Windows 降级);异步任务队列带 RPM 限流、图像/视频独立并发通道、lease 调度与断点续传;Web 工作台管理项目、预览素材、版本回滚、SSE 实时任务追踪,并可导出剪映草稿。
来源:README 核心能力「异步任务队列」「可视化工作台」、功能特性「沙箱化 Agent 运行环境」、工作流程图(导出剪映草稿)ArcReel 是 Python 3.12 + FastAPI 后端、React 19 前端的全栈应用。后端在 server/ 与 lib/,用 Claude Agent SDK 编排多智能体:一个编排 Skill 检测项目状态并调度若干聚焦 Subagent,各自完成剧本/设计/分镜/视频任务;agent 工具调用跑在 bwrap 沙箱内按白名单授权(POSIX-only,Windows 自动降级)。任务由异步队列驱动(RPM 限流、图像/视频独立并发、lease 调度、断点续传),状态经 SSE 推给前端工作台。数据层用 SQLite(默认)或 PostgreSQL(生产),用 alembic 管理迁移。仓库还含 frontend/(React 工作台)、deploy/(Docker compose,默认与 production 两套)、agent_runtime_profile/、openspec/、vertex_keys/(Vertex AI 凭据)、scripts/、tests/、docs/、projects/(项目数据)。生成的视频由 FFmpeg 合成,并可导出剪映草稿。多供应商(图像/视频/文本)通过统一接口接入,支持自定义 OpenAI/Google 兼容端点。
来源:README 核心能力/功能特性/快速开始、仓库目录树(server/lib/frontend/deploy/alembic/tests/agent_runtime_profile/vertex_keys 等)、徽章(Python/React/FastAPI/Claude Agent SDK)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
Claude Agent SDK(Anthropic,编排)图像:Gemini / 火山方舟 / Grok / OpenAI / V…视频:Veo 3.1 / Seedance / Grok / Sora …FFmpeg(合成)、剪映草稿导出bwrap(agent 沙箱)、alembic(迁移)SQLite / PostgreSQL面向想把文字内容批量转成视频的创作者与团队:网络小说/故事改编成连续短视频或剧集动画、说书类内容自动配图配镜、用统一工作台管理多集项目并保持角色与场景一致;多供应商可按成本/效果自由切换,产出可导出到剪映继续精修。对开发者,它也是研究「用 Claude Agent SDK 编排多智能体跑长流程创意流水线」「跨镜一致性如何用设计图+线索追踪实现」的完整参考。注意生成内容应遵守各模型供应商条款与版权/肖像等法规。
来源:README 顶部简介、核心能力、功能特性项目通过 GitHub Releases 发版并提供 ghcr.io Docker 镜像,迭代活跃(含 Tests/Coverage/CodeQL 工作流)。功能已覆盖小说到成片的完整流水线、跨镜一致性、多供应商图像/视频/文本、两种内容模式与三种视频生成模式、沙箱化 agent、异步队列与剪映导出。仓库最近一次更新在采集日当天(2026-05-23)。
来源:README 徽章(Release/Docker/Tests)、功能特性、GitHub meta pushed_at 2026-05-23ArcReel 是开源 AI 视频生成里少见地「把整条小说改编流水线做完整」的项目:AI Agent 编排从小说到成片,并用设计图+线索追踪正面解决跨镜角色/场景一致性这个最棘手的问题,多供应商可切换、工程设施(沙箱、队列、限流、追踪、测试)也相当到位,还能导出剪映继续精修。对做小说改编、说书或剧集动画的创作者和团队很有价值,也是研究多智能体长流程编排的好范例。需要权衡的是 AGPL 的商用约束、多家云模型带来的生成成本、对 POSIX/Docker 环境的偏好,以及长篇仍需人机协作而非全自动。作为可自托管、追求一致性产出的 AI 视频工作台,它的完整度和工程质量都很突出。
来源:综合 README、核心能力、功能特性与 GitHub meta 的事实判断