ppt-master 是什么?

PPT Master(作者 Hugo He)能让 AI 从任意文档(PDF、DOCX、URL、Markdown)生成「原生可编辑」的 PowerPoint——输出的是真正的形状、文本框、图表(不是图片),在 PowerPoint 里点开任何元素都能改。它本身是一个「harness(工作流/技能)」而非完整 agent,运行在 Claude Code、Cursor、VS Code + Copilot 等 AI IDE 里:你用自然语言说「用这份 PDF 做一份 deck」,它按工作流在你电脑上产出真实可编辑的 .pptx。许可为 MIT,Python,约 20,305 stars;数据本地处理、无平台锁定、支持多模型。

⭐ 21,611 Stars 🍴 1,992 Forks Python MIT 作者: hugohe3
来源:README.md(标题、首段、harness 说明、How it works、四点差异);GitHub 仓库元数据(stars=20305、license=MIT、language=Python) 查看 GitHub 仓库 →

为什么值得关注

AI 做 PPT 很常见,但多数产出是「图片化、不可编辑」的伪 PPT,或绑定某平台、要单独订阅。PPT Master 主打三件事:产物是原生可编辑的真 PPTX、数据留在本地(除与 AI 模型通信外全本地)、无平台锁定(多 IDE 多模型),还支持模板复刻、原生动画、配音/视频导出等。对常要编辑 deck 的专业用户痛点明确,因而获得高关注。截至数据采集约 20,305 stars。

来源:README.md(PPT Master is different 四点、Features 段落);GitHub 仓库元数据(stars=20305)

核心功能

原生可编辑 PPTX

从 PDF/DOCX/URL/Markdown 生成真实形状/文本框/图表的可编辑 PowerPoint,而非图片,点击即可编辑。

来源:README.md(标题、首段、Real PowerPoint)
实时预览与可视化编辑

生成时在 localhost:5050 自动预览,点选元素写改动、提交标注后说「apply my annotations」,AI 重写并重导出。

来源:README.md(Live Preview & Visual Edits)
模板复刻与原生动画

用 /create-template 从任意 .pptx 提取主题/字体/母版布局/图片做成私有模板;导出页面切换与元素入场为真实 OOXML 动画,PowerPoint/Keynote 原生播放。

来源:README.md(Template Replication、Animations)
配音与视频导出

从备注生成逐页配音(edge-tts 或云 TTS)嵌回 PPTX,并由 PowerPoint 导出带配音与转场的 MP4;可选用自带授权的克隆语音。

来源:README.md(Narration & Video、Voice Cloning)

技术架构

PPT Master 是一个「技能/工作流」,在具备 agent 能力(读写文件、执行命令、多轮对话)的 AI IDE 里运行。它把文档解析、版式生成、导出为 OOXML 的 PPTX 等串成流程:生成时浏览器预览(localhost:5050)自动打开,可点选元素写改动、提交标注后让 AI 重写 SVG 并重导出 PPTX(Live Preview);可用 /create-template 从任意 .pptx 提取主题色/字体/母版与布局/可复用图片乃至雪碧图裁剪关系做成私有模板;导出的动画(页面切换 + 元素入场)是真实 OOXML、在 PowerPoint/Keynote 原生播放;还能从备注用 edge-tts(或云 TTS)生成逐页配音并嵌回 PPTX、再由 PowerPoint 导出 MP4。本地只需 Python(部分旧格式需 pandoc)。作者强调「harness + model = agent」,推荐配大上下文 Claude + gpt-image-2 以达到质量上限。

来源:README.md(How it works、Live Preview、Template Replication、Animations、Narration & Video、Quick Start、harness 说明)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) AI IDE:Claude Code/Cursor/VS Code Copilot 等AI IDE:Claude… 模型:推荐 Claude + gpt-image-2,也支持 GPT/Gemini/Kimi 等模型:推荐 Clau… edge-tts/云 TTS(配音)、pandoc(旧格式,可选)edge-tts/云 TT… 原生可编辑 PPTX 实时预览与可视化编辑 模板复刻与原生动画 配音与视频导出 ppt-master 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python框架AI IDE 内运行的技能/工作流(harness);OOXML/PPTX 生成
AI IDE:Claude Code/Cursor/VS Code Co…模型:推荐 Claude + gpt-image-2,也支持 GPT/G…edge-tts/云 TTS(配音)、pandoc(旧格式,可选)
本地运行(仅需 Python);数据除与模型通信外全本地;浏览器预览 localhost:5050
来源:README.md(How it works、Quick Start、Pick an Agent、Narration);GitHub 仓库元数据(language=Python)

快速上手

只需 Python:下载/克隆仓库后 pip install -r requirements.txt(旧文档格式 .doc/.odt 等需另装 pandoc,Windows 有专门安装指南)。然后在一个具备 agent 能力的 AI IDE(Claude Code/Cursor/VS Code Copilot 等)里打开项目,用自然语言说「用这份 PDF/DOCX 做一份 deck」,它会按工作流生成可编辑 .pptx,并自动开 localhost:5050 预览供可视化标注。模型推荐用大上下文的 Claude + gpt-image-2 以达最佳质量。注意:配音的「语音克隆」功能应仅用自己或已获授权者的声音;README 中的第三方 API 中转赞助商属按量代充服务,使用任何模型请用合规渠道并遵守条款。
来源:README.md(Quick Start、Pick an Agent、Live Preview、Voice Cloning、赞助商说明);合规判断

使用场景

适合需要从文档快速产出「可继续编辑」的演示的人,尤其是常要审改 deck 的专业人士(作者本人是财务/咨询背景):把 PDF/Word/网页/Markdown 转成真实可编辑的 PPT、复刻公司或客户的模板品牌、加原生动画、生成配音并导出视频。它本地运行、数据可控、不锁平台,适合在意可编辑性与数据隐私的场景。语音克隆需在获授权前提下使用。

来源:README.md(首段、Built by Hugo He、Features);合规判断

优势与局限

优势

  • 产物是原生可编辑的真 PPTX(形状/文本/图表/动画),不是图片
  • 本地运行、数据可控、无平台锁定,支持多 IDE 多模型
  • 模板复刻、实时可视化编辑、配音与视频导出能力齐全
  • 免费开源(只付模型用量),痛点明确、作者专业背景

局限

  • 是 harness 而非完整 agent,质量上限取决于所用模型(推荐大上下文 Claude + gpt-image-2)
  • 需要在 AI IDE 内运行并配置模型,门槛高于一键网页工具
  • 语音克隆涉及他人声音,须获授权、合规使用
  • README 推荐的第三方 API 中转赞助商属灰色代充,建议用官方/合规渠道
来源:README.md(harness 说明、Pick an Agent、Voice Cloning、赞助商);合规判断

最新版本

本页未列出具体版本号;PPT Master 以 AI IDE 内的技能/工作流持续迭代,近期加入了实时预览可视化编辑(基于社区 PR)、/create-template 模板复刻、原生 OOXML 动画、备注配音与 MP4 导出、以及自带授权的语音克隆等。更新以提升可编辑性、模板与多媒体能力为主。

来源:README.md(Live Preview/Template/Animations/Narration 各段落)

总结评价

PPT Master 解决了 AI 做 PPT 的一个核心痛点:产物是原生可编辑的真 PPTX(形状/文本/图表/动画),而非图片,并且本地运行、数据可控、不锁平台,还支持模板复刻、可视化编辑和配音/视频导出。对常要审改演示的专业用户很实用。要清楚它是 harness、质量取决于所用模型(推荐大上下文 Claude + gpt-image-2)、需在 AI IDE 内配置使用,语音克隆需获授权,且 README 的第三方 API 中转赞助商属灰色代充(建议走官方渠道)。作为「让 AI 产出可编辑 PPT」的开源工作流,它定位清晰、能力扎实。

来源:综合 README.md 的可编辑性主张、能力与 harness/模型/合规考量
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 14:11. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件