TaxHacker 是什么?

TaxHacker(vas3k 出品)是一个自托管的 AI 记账应用,面向自由职业者、独立开发者与小企业:上传收据、发票或 PDF 照片,它用 LLM 自动识别并抽取记账所需信息——商品名、金额、明细、日期、商家、税额等——存进类 Excel 的结构化数据库,还能用自定义 AI 提示创建任意字段。它带历史汇率的自动多币种换算(含加密货币)、多项目、自定义分类、过滤与导入导出,让报税与对账更省事。模型可换(OpenAI/Gemini/Mistral 或本地 Ollama/LocalAI 等),支持自托管以保护数据隐私。TypeScript、MIT、约 5,700 星。注意项目仍处早期开发。

⭐ 308 Stars 🍴 51 Forks TypeScript 作者: vas3k
来源:README 顶部简介/Features、GitHub meta(vas3k/TaxHacker,TypeScript,MIT,homepage taxhacker.app) 查看 GitHub 仓库 →

为什么值得关注

记账里最枯燥的就是把一堆收据发票手动录入,自由职业者与小企业尤其痛。TaxHacker 用 LLM 把「拍张照→自动识别分类入库」做成一站完成,还解决了跨境/多币种(含加密)按交易日历史汇率换算这个真实麻烦,并且可自定义字段与提示、可本地模型自托管保隐私。出自知名博主 vas3k、MIT 开源、对接多家与本地 LLM,实用且隐私友好,因此受到关注(约 5,700 星)。

来源:README 顶部简介/Features、GitHub meta(stars 5736、created_at 2025-03-10、pushed_at 2026-04-17)

核心功能

AI 识别收据/发票并结构化入库

拍照或传 PDF,AI 自动识别、抽取、分类并存为结构化数据库:日期、金额、商家、明细等;支持先放「未分类」稍后批处理、按内容自动归类、把发票明细拆成单独交易,兼容店票/餐票/发票/银行流水甚至手写票,任意语言货币。

来源:README Feature 1(Analyze photos and invoices with AI)
多币种与加密货币自动换算

自动识别文档币种并按交易当日历史汇率换算到基准货币,覆盖 170+ 法币与 14 种主流加密货币(BTC/ETH/LTC/DOT 等),也可手动录入。

来源:README Feature 2(Multi-currency support)
自定义字段/分类/项目与提示词

可建无限自定义字段(像 Excel 加列)、分类与项目按需分组;并能为字段/分类/项目写自定义 AI 提示,甚至改系统提示,完全掌控抽取逻辑、适配行业与国别需求;支持全文搜索、高级过滤与批量操作。

来源:README Feature 4/5(custom fields/categories、customizable prompts)
自带 LLM(含本地)与自托管隐私

可用 OpenAI、Google Gemini、Mistral,或对接本地 OpenAI 兼容端点(Ollama/LM Studio/vLLM/LocalAI),自托管让财务数据留在自己机器;并支持灵活过滤导出为 CSV(含附件)、生成报税报告、完整数据归档可迁移。

来源:README Feature 3/6/7(local LLM/export/self-hosted)

技术架构

TaxHacker 是一个 TypeScript 全栈 Web 应用(Next.js 风格目录:app/、components/、hooks/、lib/、forms/),用 Prisma(prisma/)做数据层、ai/ 封装 LLM 抽取逻辑、models/ 定义数据模型。流程是:上传文档→ai 模块按所选 LLM(OpenAI/Gemini/Mistral 或本地 OpenAI 兼容端点)做 OCR 与结构化抽取,依据可自定义的字段/分类/项目提示把结果写入数据库;多币种按历史汇率换算;前端提供表格视图、全文搜索、过滤与 CSV 导出(含附件)。可自托管(home server ready,etc/ 与 docs/ 含部署/截图)。系统与字段级提示均可在设置里改,整套抽取流程对用户透明可调。

来源:README Features/Self-hosted、仓库目录树(ai/app/components/lib/models/prisma/forms/etc)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) LLM:OpenAI / Google Gemini / Mistral / 本地 OpenAI 兼容(Ollama/LM Studio/vLLM/LocalAI)LLM:OpenAI /… Prisma(数据库 ORM)Prisma(数据库… 历史汇率(170+ 法币 + 14 加密货币)历史汇率(170+… CSV 导出 / 全文搜索CSV 导出 / 全文… AI 识别收据/发票并结构化入库AI 识别收据/发票并结… 多币种与加密货币自动换算多币种与加密货币自动换… 自定义字段/分类/项目与提示词自定义字段/分类/项目… 自带 LLM(含本地)与自托管隐私自带 LLM(含本地)与… TaxHacker 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言TypeScript框架Next.js 风格全栈 Web 应用 + Prisma 数据层
LLM:OpenAI / Google Gemini / Mistral…Prisma(数据库 ORM)历史汇率(170+ 法币 + 14 加密货币)CSV 导出 / 全文搜索
自托管 Web 应用(home server ready),数据本地存储;亦有官方托管版 taxhacker.app
来源:README Features/Self-hosted、仓库结构(prisma/ai/models)

快速上手

可用官方托管版 taxhacker.app,或自托管(README/docs 提供部署说明,适合家用服务器)。配置一个 LLM:填 OpenAI/Gemini/Mistral 的 key,或对接本地 OpenAI 兼容端点(Ollama/LM Studio/vLLM/LocalAI,注意本地模型 OCR 质量不保证)。使用:上传收据/发票/PDF,AI 自动抽取并归类入库,按需在设置里改系统/字段提示、建自定义字段与分类、设基准货币做多币种换算,再用过滤导出 CSV(含附件)或生成报税报告。项目仍处早期开发,使用前留意风险。
来源:README 顶部/Features/Self-hosted、IMPORTANT 提示

使用场景

适合自由职业者、独立开发者与小企业自动化费用与收入记账:把成堆收据发票一拍/一传就抽成结构化数据、自动分类、跨境多币种(含加密)按历史汇率换算、用自定义字段适配行业或国别、导出 CSV 与报税报告交给会计或税务顾问。注重隐私者可自托管 + 本地模型让财务数据不出机。本质是「记账自动化与整理工具」——它帮你提取整理数据,但不构成税务/会计专业意见,正式申报仍应由你或会计核对负责。

来源:README 顶部简介/Features

优势与局限

优势

  • 切中记账最枯燥环节:拍照/上传即 AI 抽取分类入库,省去手动录入,支持多语言多货币与发票明细拆分。
  • 多币种含加密、按历史汇率换算,对跨境与数字资产场景很实用。
  • 高度可定制且透明:自定义字段/分类/项目与可改的系统/字段提示,整套抽取逻辑用户可控。
  • 隐私友好:可自托管 + 本地 LLM,数据留本机;MIT 开源、可导出迁移、不锁定。

局限

  • 项目自述仍处早期开发,作者提示「自担风险」,稳定性与边缘情况待打磨。
  • 抽取质量取决于所选 LLM 与文档质量,本地模型 OCR 效果不保证,复杂/手写票仍需人工核对。
  • 用云端 LLM 时财务文档会发往模型厂商,隐私需权衡(故提供本地与自托管选项)。
  • 不构成税务/会计意见:它整理数据但不替代专业核对与申报,准确性责任在用户。
来源:README IMPORTANT/Features(local LLM 说明)、自托管与隐私

最新版本

项目以自托管 Web 应用 + 官方托管版(taxhacker.app)提供,迭代中(自述早期开发)。功能已覆盖 AI 识别入库、多币种含加密的历史汇率换算、自定义字段/分类/提示、本地与多家 LLM、过滤导出与报税报告。MIT 开源。仓库最近一次更新在 2026-04-17。

来源:README Features/IMPORTANT、GitHub meta pushed_at 2026-04-17、created_at 2025-03-10

总结评价

TaxHacker 把记账里最烦的「手动录收据发票」交给 AI:拍照或上传即抽取、分类、入库,还把跨境多币种(含加密)按历史汇率换算这件真麻烦事一并解决,字段与提示全可自定义、可导出报税报告。对自由职业者和小企业很对路,且能自托管 + 本地模型把财务数据留在自己手里,MIT 开源、不锁定。要理解它仍是早期项目(自担风险)、抽取质量随模型与文档而定、复杂票据需人工核对,且它整理数据但不替代专业税务核对。作为「隐私友好、可定制的 AI 记账」开源方案,它的实用性与隐私取向都很受用。

来源:综合 README、Features、自托管与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 20:12. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件