PPT Master(作者 Hugo He)能让 AI 从任意文档(PDF、DOCX、URL、Markdown)生成「原生可编辑」的 PowerPoint——输出的是真正的形状、文本框、图表(不是图片),在 PowerPoint 里点开任何元素都能改。它本身是一个「harness(工作流/技能)」而非完整 agent,运行在 Claude Code、Cursor、VS Code + Copilot 等 AI IDE 里:你用自然语言说「用这份 PDF 做一份 deck」,它按工作流在你电脑上产出真实可编辑的 .pptx。许可为 MIT,Python,约 20,305 stars;数据本地处理、无平台锁定、支持多模型。
来源:README.md(标题、首段、harness 说明、How it works、四点差异);GitHub 仓库元数据(stars=20305、license=MIT、language=Python) 查看 GitHub 仓库 →AI 做 PPT 很常见,但多数产出是「图片化、不可编辑」的伪 PPT,或绑定某平台、要单独订阅。PPT Master 主打三件事:产物是原生可编辑的真 PPTX、数据留在本地(除与 AI 模型通信外全本地)、无平台锁定(多 IDE 多模型),还支持模板复刻、原生动画、配音/视频导出等。对常要编辑 deck 的专业用户痛点明确,因而获得高关注。截至数据采集约 20,305 stars。
来源:README.md(PPT Master is different 四点、Features 段落);GitHub 仓库元数据(stars=20305)从 PDF/DOCX/URL/Markdown 生成真实形状/文本框/图表的可编辑 PowerPoint,而非图片,点击即可编辑。
来源:README.md(标题、首段、Real PowerPoint)生成时在 localhost:5050 自动预览,点选元素写改动、提交标注后说「apply my annotations」,AI 重写并重导出。
来源:README.md(Live Preview & Visual Edits)用 /create-template 从任意 .pptx 提取主题/字体/母版布局/图片做成私有模板;导出页面切换与元素入场为真实 OOXML 动画,PowerPoint/Keynote 原生播放。
来源:README.md(Template Replication、Animations)从备注生成逐页配音(edge-tts 或云 TTS)嵌回 PPTX,并由 PowerPoint 导出带配音与转场的 MP4;可选用自带授权的克隆语音。
来源:README.md(Narration & Video、Voice Cloning)PPT Master 是一个「技能/工作流」,在具备 agent 能力(读写文件、执行命令、多轮对话)的 AI IDE 里运行。它把文档解析、版式生成、导出为 OOXML 的 PPTX 等串成流程:生成时浏览器预览(localhost:5050)自动打开,可点选元素写改动、提交标注后让 AI 重写 SVG 并重导出 PPTX(Live Preview);可用 /create-template 从任意 .pptx 提取主题色/字体/母版与布局/可复用图片乃至雪碧图裁剪关系做成私有模板;导出的动画(页面切换 + 元素入场)是真实 OOXML、在 PowerPoint/Keynote 原生播放;还能从备注用 edge-tts(或云 TTS)生成逐页配音并嵌回 PPTX、再由 PowerPoint 导出 MP4。本地只需 Python(部分旧格式需 pandoc)。作者强调「harness + model = agent」,推荐配大上下文 Claude + gpt-image-2 以达到质量上限。
来源:README.md(How it works、Live Preview、Template Replication、Animations、Narration & Video、Quick Start、harness 说明)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
AI IDE:Claude Code/Cursor/VS Code Co…模型:推荐 Claude + gpt-image-2,也支持 GPT/G…edge-tts/云 TTS(配音)、pandoc(旧格式,可选)适合需要从文档快速产出「可继续编辑」的演示的人,尤其是常要审改 deck 的专业人士(作者本人是财务/咨询背景):把 PDF/Word/网页/Markdown 转成真实可编辑的 PPT、复刻公司或客户的模板品牌、加原生动画、生成配音并导出视频。它本地运行、数据可控、不锁平台,适合在意可编辑性与数据隐私的场景。语音克隆需在获授权前提下使用。
来源:README.md(首段、Built by Hugo He、Features);合规判断本页未列出具体版本号;PPT Master 以 AI IDE 内的技能/工作流持续迭代,近期加入了实时预览可视化编辑(基于社区 PR)、/create-template 模板复刻、原生 OOXML 动画、备注配音与 MP4 导出、以及自带授权的语音克隆等。更新以提升可编辑性、模板与多媒体能力为主。
来源:README.md(Live Preview/Template/Animations/Narration 各段落)PPT Master 解决了 AI 做 PPT 的一个核心痛点:产物是原生可编辑的真 PPTX(形状/文本/图表/动画),而非图片,并且本地运行、数据可控、不锁平台,还支持模板复刻、可视化编辑和配音/视频导出。对常要审改演示的专业用户很实用。要清楚它是 harness、质量取决于所用模型(推荐大上下文 Claude + gpt-image-2)、需在 AI IDE 内配置使用,语音克隆需获授权,且 README 的第三方 API 中转赞助商属灰色代充(建议走官方渠道)。作为「让 AI 产出可编辑 PPT」的开源工作流,它定位清晰、能力扎实。
来源:综合 README.md 的可编辑性主张、能力与 harness/模型/合规考量