axi 是什么?

AXI(Agent eXperience Interface)是一套『为 agent 人体工学设计 CLI 工具』的 10 条设计原则。它的论点是:agent 今天访问外部服务有两条主流路径——为人设计的 CLI、和结构化的 MCP,两者都带来不小的开销(尤其是 token)。AXI 提出第三条路:agent 原生的 CLI 工具,把 token 预算当一等约束。项目本身是『原则 + 基准测试 + 参考实现 + skill』:给出 10 原则、用 490/425 次评测对比 AXI 与 MCP/普通 CLI、提供 gh-axi 与 chrome-devtools-axi 两个参考实现,并附可一键安装的 AXI skill 教你照原则自建。TypeScript,MIT。

⭐ 666 Stars 🍴 23 Forks TypeScript MIT 作者: kunchenguid
来源:README 顶部/The 10 Principles/Quick Start;GitHub desc,license MIT 查看 GitHub 仓库 →

为什么值得关注

约 810 星(体量不大但上趋势),热度来自一个正被热议的问题:MCP 真的比直接给 agent 一个 CLI 好吗?AXI 不空谈,而是用硬基准给出反直觉结论——在 GitHub 任务上 gh-axi 100% 成功、$0.050,而 GitHub MCP 仅 87%、$0.148(贵约 3 倍、慢一倍、回合数翻倍);浏览器任务上 AXI 同样在成本/回合上领先 MCP 各变体。这种『agent 原生 CLI 比 MCP 更准更省』的实证对正在选型 agent 工具接入方式的人冲击很大。

来源:GitHub 810 stars / 27 forks,created 2026-03-21;README Results

核心功能

10 条 agent 人体工学原则

定义什么样的 CLI 算 AXI:token 高效输出(用 TOON 格式省约 40% token)、最小默认 schema(每条 3-4 字段而非 10)、内容截断(带大小提示与 --full 逃生口)、预计算聚合(省往返)、明确空状态、结构化错误与退出码(幂等、无交互提示)、ambient context(agent 调用前就看到状态)、content first(无参数直接出数据而非帮助文本)、contextual disclosure(输出后给下一步建议)、一致的 help。

来源:README The 10 Principles(表)
硬基准实证 vs MCP/CLI

用 Claude Sonnet 4.6 在 GitHub(425 次:17 任务×5 条件×5 重复)和浏览器(490 次:14×7×5)上对比:gh-axi 100%/$0.050/3 回合 优于 gh CLI(86%) 与 GitHub MCP(87%/$0.148/6 回合);chrome-devtools-axi 100%/$0.074 在成本与回合上领先各 MCP 变体。

来源:README Results(Browser/GitHub Benchmark)
参考实现(gh-axi / chrome-devtools-axi)

提供两个遵循 AXI 原则的现成工具:gh-axi(GitHub 操作)和 chrome-devtools-axi(浏览器自动化),npm 全局安装后在 CLAUDE.md/AGENTS.md 里声明让 agent 用即可。

来源:README Quick Start
AXI skill 自建脚手架

`npx skills add kunchenguid/axi` 安装 AXI skill——一份带每条原则示例的详细指南,供你的编码 agent 在构建 AXI 兼容 CLI 时参考。

来源:README Build Your Own AXI
可复现的基准 harness

仓库含浏览器与 GitHub 两套基准工具:可跑单个 condition×task 或全矩阵、生成汇总报告、甚至渲染社交视频,让结论可复现、可扩展。

来源:README Development(Browser/GitHub Benchmark 命令)

技术架构

本质是『方法论 + 实证 + 工具』的组合仓库(TypeScript)。核心产出有四块:①一份 10 原则的设计规范(README + axi.md 网站);②.agents/skills/axi/ 下的 AXI skill(带每条原则示例的自建指南,可经 npx skills add 装进编码 agent);③两个独立仓库的参考实现 gh-axi、chrome-devtools-axi(不在本仓库,但是原则的落地样板);④本仓库内的基准 harness——浏览器与 GitHub 两套,可跑 condition×task 矩阵、生成汇总报告、渲染视频,用以量化对比 AXI vs MCP vs 普通 CLI。原则的具体技术手段包括 TOON(token-oriented 格式,比 JSON 省约 40% token)、最小 schema、预计算聚合、ambient session 集成等。它不提供一个运行时框架,而是把『怎么把 CLI 做得让 agent 又准又省 token』编码成可遵循、可度量、可自建的原则与样板。整体是『设计原则 + 可复现基准 + 参考实现 + skill』的 agent 工具方法论项目。

来源:README The 10 Principles/Build Your Own/Development;tree(.agents/skills/axi、benchmark harness)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) TOON(token 高效输出格式)TOON(token 高… Agent Skill(npx skills)Agent Skill(n… Claude Sonnet 4.6(基准模型)Claude Sonnet… gh-axi / chrome-devtools-axi(参考实现)gh-axi / chrom… MCP / CLI(对比基线)MCP / CLI(对比… 10 条 agent 人体工学原则10 条 agent 人体工学… 硬基准实证 vs MCP/CLI 参考实现(gh-axi / chrome-devtools-axi)参考实现(gh-axi / c… AXI skill 自建脚手架 可复现的基准 harness axi 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言TypeScript框架设计原则 + 基准 harness + Agent Skill
TOON(token 高效输出格式)Agent Skill(npx skills)Claude Sonnet 4.6(基准模型)gh-axi / chrome-devtools-axi(参考实现)MCP / CLI(对比基线)
npm 安装参考 CLI;agent 经 CLAUDE.md/AGENTS.md 调用;基准 harness 本地跑矩阵
来源:README The 10 Principles/Quick Start/Development

快速上手

用现成实现:`npm install -g gh-axi` 和 `npm install -g chrome-devtools-axi`,然后在 CLAUDE.md/AGENTS.md 里写『Use gh-axi for GitHub and chrome-devtools-axi for browser automation』,agent 即会优先用它们(更准更省 token)。想自建符合 AXI 的 CLI:`npx skills add kunchenguid/axi` 装 AXI skill,让编码 agent 照 10 原则与示例构建。想复现/扩展基准:用仓库 Development 章节的命令跑浏览器或 GitHub 的 condition×task 矩阵并生成报告。
来源:README Quick Start/Build Your Own AXI/Development

使用场景

适合:①在为 agent 选『怎么接外部服务』(MCP vs CLI vs AXI)的工程师,想看硬数据再决策;②想给自己的 CLI 工具做 agent 优化、降 token、提成功率的人(照 10 原则改造);③直接用 gh-axi/chrome-devtools-axi 让 Claude Code 等更高效操作 GitHub/浏览器的人;④研究 agent 工具人体工学/token 经济的人。不适合:需要 MCP 特有能力(如统一发现、跨工具编排、非 CLI 集成)的场景;以及不在乎 token 成本、现有 MCP/CLI 已够用的人。

来源:README 顶部/Results/Quick Start,结合定位推断

优势与局限

优势

  • 观点鲜明且有实证:用 490/425 次基准给出『agent 原生 CLI 比 MCP 更准更省 token』的硬数据,不空谈
  • 10 原则可操作:每条都对应具体做法(TOON、最小 schema、预计算聚合、ambient context 等),可直接照着改造 CLI
  • 落地完整:给了 gh-axi/chrome-devtools-axi 两个参考实现 + 自建 skill + 可复现基准 harness
  • 对 token 经济的关注切中要害:把 token 预算当一等约束,对成本敏感的 agent 应用价值大
  • MIT、轻量、易上手(npm 装 + 一行 CLAUDE.md 声明)

局限

  • 基准是项目自评(特定模型/任务集),结论虽有冲击力但需独立复现,未必泛化到所有场景
  • AXI 是 CLI 范式,放弃了 MCP 的统一发现/跨工具编排/非 shell 集成等能力,并非全场景替代
  • 价值依赖生态:目前主要是 gh/chrome 两个参考实现,覆盖面有限,更多服务需自建
  • 本质是原则与样板而非框架,真正收益取决于你是否按原则把工具做对
  • 项目较新、体量小(810 星),长期采用与生态扩展仍待观察
来源:README Results/The 10 Principles;自评基准与范式取舍推断

最新版本

仓库以原则文档 + 基准 harness + skill 形式维护,无传统 GitHub Release;主分支活跃(最近 push 2026-05-23,创建于 2026-03-21)。参考实现 gh-axi、chrome-devtools-axi 在各自仓库迭代,配套网站 axi.md。处于早期但论点与样板已成形的阶段。

来源:GitHub pushed_at 2026-05-23;README Quick Start/Links

总结评价

AXI 把一个正被热议的问题摆到台面上并给了实证答案:给 agent 接服务,MCP 未必最优。它用 10 条可操作的设计原则(TOON 省 token、最小 schema、预计算聚合、ambient context 等)定义『agent 原生 CLI』,并用 490/425 次基准展示 gh-axi/chrome-devtools-axi 在成功率、成本、回合数上普遍优于对应 MCP——这种『更准更省』的数据对正在选型的人很有说服力。要清醒:基准是自评、需独立复现,且 AXI 放弃了 MCP 的统一发现/跨工具编排等能力、生态目前也只有两个参考实现。作为一套关于 agent 工具人体工学和 token 经济的方法论 + 样板,它很值得读和试;但别当成 MCP 的全场景替代。

来源:综合 README 论点/原则/基准、tree 结构、范式取舍的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 16:37. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件