DeepTutor 是什么?

DeepTutor 是港大数据智能实验室(HKUDS)开源的「智能体原生」个性化辅导系统。它把聊天、解题、出题、研究、可视化等学习能力建立在一套统一的智能体引擎上,配以可版本化的知识库(RAG)、三层记忆、可持久自治的 TutorBot 和一个智能体原生 CLI,目标是提供可深度个性化、可审计、可自托管的 AI 辅导。许可为 Apache-2.0,后端 Python(3.11+)、前端 Next.js 16,约 24,244 stars,有 arXiv 论文与多语言文档。

⭐ 23,710 Stars 🍴 3,143 Forks Python 作者: HKUDS
来源:README.md(标题、Key Features、徽章);GitHub 仓库元数据(stars=24244、license=Apache-2.0、language=Python) 查看 GitHub 仓库 →

为什么值得关注

AI 辅导是高价值场景,但多数产品是封闭、单一对话框;DeepTutor 走「智能体原生 + 开源 + 可自托管」路线,把学习的多种能力(解题/出题/研究/可视化/共写)统一在一个会话与知识库上,并加入三层可审计记忆、把材料编译成交互式「活书」、以及可常驻的个性化 TutorBot,覆盖面与可控性都强。来自知名实验室、迭代极快、文档多语言,因而获得高关注。截至数据采集约 24,244 stars。

来源:README.md(Key Features、Releases 频繁迭代、多语言徽章);GitHub 仓库元数据(stars=24244)

核心功能

统一智能体引擎的多种学习能力

Chat、Solve、Quiz、Research、Visualize 共享同一会话、知识库与引用历史,可在对话中途升级而不丢上下文;Co-Writer 提供分屏 Markdown 共写、按选区重写/扩写/缩写并可用 KB/网络接地。

来源:README.md(Key Features → Work surfaces)
可版本化知识库与三层记忆

基于 LlamaIndex 的版本化 RAG 知识库(索引可追踪/对比/回滚);三层记忆(L1 轨迹、L2 带引用事实、L3 跨界面综合)配可检视工作台与记忆图,便于审计来源。

来源:README.md(Key Features → Knowledge Bases、Three-layer memory)
持久自治 TutorBot 与活书

可常驻、自治的个性化 TutorBot(各有工作区/人设/技能/多渠道,基于 nanobot);Book Engine 把材料编译成含 13 种区块的交互式「活书」,页面按 KB 指纹检测漂移。

来源:README.md(Key Features → Personal TutorBots、Book Engine)
智能体原生 CLI 与可组合工具

每个能力/知识库/会话/TutorBot 都可一条命令调用,对人富输出、对智能体输出结构化 JSON,把 SKILL.md 交给任意工具型 LLM 即可自主驱动;工具可组合并支持 MCP。

来源:README.md(Key Features → Agent-native CLI、Composable tools)

技术架构

DeepTutor 是 Python 后端 + Next.js 16 前端的应用,所有聊天能力(Chat/Solve/Quiz/Research/Visualize)重建在单一智能体引擎上、共享会话、知识库与引用历史。知识库是端到端基于 LlamaIndex 的可版本化 RAG 集合(每次索引可追踪、对比、回滚);记忆分三层:仅追加的 L1 轨迹、按界面整理且带引用的 L2 事实、跨界面综合的 L3,并提供可检视的记忆工作台与记忆图来审计「它为什么知道这些」。工具可组合(RAG、网搜、代码执行、推理、论文检索、GeoGebra 分析等,并可插入 MCP server)。TutorBot 是常驻自治辅导,各有自己的工作区、人设(soul)、技能与渠道(Telegram/Discord/Slack/Matrix/Zulip 等),基于 HKUDS 的 nanobot。还有 Book Engine 多智能体管线把材料编译成含 13 种区块(测验、闪卡、时间线、概念图、内嵌 GeoGebra、动画等)的交互式「活书」。可选鉴权(默认关闭)支持多用户部署(bcrypt+JWT、管理后台、可选 PocketBase/OAuth)。

来源:README.md(Key Features 的 Work surfaces / Your library / Extensibility & control、Multi-User、Releases v1.4.0)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) LlamaIndex(RAG)LlamaIndex(RA… nanobot(TutorBot 基础)nanobot(Tutor… MCP server(可插拔工具)MCP server(可… 多家 LLM/嵌入提供商(OpenAI/Gemini/NVIDIA NIM 等)多家 LLM/嵌入提… 统一智能体引擎的多种学习能力统一智能体引擎的多种学… 可版本化知识库与三层记忆可版本化知识库与三层记… 持久自治 TutorBot 与活书持久自治 TutorBot 与… 智能体原生 CLI 与可组合工具智能体原生 CLI 与可组… DeepTutor 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python 3.11+(后端)+ TypeScript/Next.js 16(前端)框架统一智能体引擎 + Next.js 前端
LlamaIndex(RAG)nanobot(TutorBot 基础)MCP server(可插拔工具)多家 LLM/嵌入提供商(OpenAI/Gemini/NVIDIA NI…
本地/Docker/远程部署;可选多用户鉴权(bcrypt+JWT,PocketBase/OAuth 可选);CLI 提供 deeptutor start
来源:README.md(徽章、Key Features、Multi-User、Releases)

快速上手

按 deeptutor.info 文档安装(提供本地、Docker 与远程部署选项),后端需 Python 3.11+、前端为 Next.js 16;CLI 有 deeptutor start 等命令。配置在统一的 Settings 工作台里以 draft/Apply 方式管理外观、模型、嵌入、搜索、能力、记忆、MCP server 与工具,并带按调用的成本跟踪。鉴权默认关闭,单机即可用;要做多用户共享部署可开启鉴权(bcrypt+JWT、管理后台、可选 PocketBase/OAuth 边车)。把 SKILL.md 交给支持工具调用的 LLM 即可让其自主驱动 DeepTutor。
来源:README.md(Get Started、Unified settings、Optional authentication、Agent-native CLI)

使用场景

适合个人学习者、教育者和教育产品团队:把自己的资料建成知识库后做接地问答、解题、出题、研究与可视化;用 Co-Writer 辅助写作并存进笔记本;把材料编译成交互式「活书」用于学习/教学;部署常驻的个性化 TutorBot 在 Telegram/Discord 等渠道随时辅导;或做多用户共享部署(每人独立工作区)。开源可自托管、记忆可审计的特性也适合在意数据掌控与可解释性的教育场景。

来源:README.md(Key Features、Multi-User、首段定位)

优势与局限

优势

  • 智能体原生、能力统一(解题/出题/研究/可视化/共写共享会话与 KB)
  • 可版本化 RAG + 三层可审计记忆,能解释「为何知道」,可解释性强
  • 持久自治 TutorBot、交互式活书、智能体原生 CLI 与 MCP,可扩展性高
  • 开源可自托管、支持多用户、来自知名实验室、迭代极快、多语言

局限

  • 功能体系庞大,完整部署与配置(模型/嵌入/RAG/记忆/MCP)有学习成本
  • 效果依赖所接入的 LLM/嵌入与资料质量
  • 多用户/远程部署涉及鉴权与运维,需要一定工程能力
  • 迭代很快,部分能力可能仍在快速演进/调整
来源:README.md(Key Features、Releases 迭代、Multi-User、Unified settings)

最新版本

最新为 v1.4.0(2026-05-22)GA:引入 Auto Mode、三层记忆、智能体化的 Deep Research/Solve/Question、LlamaIndex RAG 重构、Visualize/Animator 合并,以及推理强度归一化、工具 schema 回退和重启安全的回合运行时。此前 v1.3.x 系列陆续加入多用户部署、版本化知识库索引、用户自编技能系统、文档附件、TutorBot 多渠道(含 Zulip)与 NVIDIA NIM 支持等。整体迭代非常密集。

来源:README.md(Releases 段落,v1.4.0 与 v1.3.x 列表)

总结评价

DeepTutor 是开源 AI 辅导里少见的「智能体原生、能力统一、可审计、可自托管」的完整方案:解题/出题/研究/可视化共享会话与知识库,配版本化 RAG、三层可审计记忆、交互式活书、常驻 TutorBot 和智能体 CLI/MCP,来自知名实验室且迭代极快。对个人学习者、教育者和教育产品团队都很有价值,尤其在意数据掌控与可解释性的场景。要权衡的是功能体系大、部署配置有学习成本、效果依赖所接模型与资料。作为开源个性化辅导平台,它覆盖广、设计先进、生态完善。

来源:综合 README.md 的能力体系、可解释记忆设计与迭代节奏
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 13:10. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件