harness 是什么?

harness 是 revfactory 为 Claude Code 做的元技能(meta-skill)插件——一句「build a harness for this project」自动把领域描述转成 Agent Team 加配套 Skill 文件,按 Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation 六种团队架构模式之一生成 .claude/agents/ 与 .claude/skills/;自我归类为 L3 Meta-Factory 的 Team-Architecture Factory 子层,README 三语 EN/KO/JA,作者附 n=15 A/B 实验报告 +60% 平均质量、15/15 win rate、-32% 输出方差,Apache-2.0。

⭐ 3,350 Stars 🍴 505 Forks HTML 作者: revfactory
来源:README Overview / Key Features / Category — Where Harness Sits / Research:A/B Testing Harness Effectiveness 节 查看 GitHub 仓库 →

为什么值得关注

2026 上半年 Claude Code 的 Agent Teams 与 Skills 系统进入实验功能(`CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1`),社区开始大量造「meta-skill」——让一句话把多 Agent 的角色分工 + 协作协议 + 验证流程一次写完。harness 是这条赛道里把方法论做得最透的一个:把团队协作抽象成 6 个有古典分布式系统血统的架构模式(Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation),按 6-Phase 工作流(Audit / Domain Analysis / Team Design / Agent Gen / Skill Gen / Orchestration / Validation)依次落地,每个阶段都有 references/*.md 模板兜底;附带 100 个已生成的 production-ready 团队仓库 `revfactory/harness-100`(10 个领域 EN + KO 200 个包、1808 文件)作为实例库;A/B 实验论文 + 显式标注 n=15 / 作者自测 / 第三方复现仍未做。结果是 6 周 3345★ / 505 fork,与 Archon(runtime-config 工厂)、wshobson/agents(角色目录)等邻居形成清晰的「同层异职」生态。

来源:README Overview / Workflow / Star History / Built with Harness / Research / Coexistence 节

核心功能

6 种团队架构模式作为可枚举的设计语言

Pipeline(顺序依赖任务)、Fan-out/Fan-in(并行无依赖任务后汇总)、Expert Pool(按上下文选择性调用领域专家)、Producer-Reviewer(生成后评审闭环)、Supervisor(中心 Agent 动态分发任务)、Hierarchical Delegation(自上而下递归委派)。这套词汇直接搬自分布式系统/微服务体系,给「多 Agent 协作」提供了可枚举、可对比、可教学的设计空间。具体细节在 skills/harness/references/agent-design-patterns.md。

来源:README Architecture Patterns 表、skills/harness/references/agent-design-patterns.md
6-Phase 工作流:从领域一句话到 .claude/ 落盘

Phase 0 现状审计(读 .claude/agents/ / .claude/skills/ / CLAUDE.md 检测 drift)→ Phase 1 领域分析 + 用户技术水平识别 → Phase 2 团队架构设计(Agent Teams / Subagents / Hybrid 三选一 + 6 模式之一)→ Phase 3 生成 agent 定义文件 → Phase 4 生成 skill 文件(Progressive Disclosure)→ Phase 5 集成与编排(CLAUDE.md 只放 pointer 不放重复列表)→ Phase 6 验证与测试(trigger 验证 + dry-run + 有/无 Skill 对比)。Phase 0 让 harness 可重复执行不会推翻已有配置——这是它与一次性 scaffold 工具的关键区别。

来源:skills/harness/SKILL.md(443 行,6-Phase 工作流)、README Workflow 节
三种执行模式 + Hybrid(v1.2.0 新增)

默认 Agent Teams 模式(TeamCreate + SendMessage + TaskCreate,2+ Agent 协作场景),可选 Subagents 模式(Agent 工具直调,一次性任务无需互相通信),v1.2.0 新增 Hybrid 模式(按 Phase 混合:例如 Phase 3 用 Subagents 并行收集 → Phase 5 用 Team 合议通过)。CHANGELOG 显式列出常见组合(并行收集→合议、团队生成→验证、Phase 间团队重组)。

来源:README Execution Modes 表 + CHANGELOG.md v1.2.0 Phase 2-1 Hybrid 模式
Harness Evolution Mechanism(自我进化)

harness 把生成出来的初始团队当作「初稿」,鼓励用户在真实项目里继续打磨;当 shipped 团队稳定后跑 `/harness:evolve`,捕获「初始 → shipped」的 delta(哪些角色被合并 / 哪些 skill 被拆出 / 哪些消息协议被改写),把 delta 反馈回 factory 让下一次同领域生成从 shipped 状态附近开始。README 用一张闭环箭头图说明这套机制(KR 하네스 진화 메커니즘 / JA ハーネス進化メカニズム)。

来源:README Harness Evolution Mechanism 节
三语 README + 三语触发词 + Claude Code 插件市场分发

README.md(EN)、README_KO.md、README_JA.md 同步维护,对应触发词三语化:'build a harness for this project' / '하네스 구성해줘' / 'ハーネスを構成して',SKILL.md frontmatter description 也是韩文 + 多触发短语关键词工程。分发走 Claude Code Plugin Marketplace 标准两步(`/plugin marketplace add revfactory/harness` + `/plugin install harness@harness`),也支持直接 cp 到 ~/.claude/skills/harness/。.claude-plugin/plugin.json 把 keywords 扩到 17 个覆盖 6 个模式名 + harness-factory + multi-agent + agent-scaffolding。

来源:README 三语 + skills/harness/SKILL.md frontmatter + .claude-plugin/{plugin.json, marketplace.json}
Coexistence 生态自我定位(L3 Meta-Factory)

README 专门一节用「X is …, Harness is …」并排对比 5 个邻居仓库:coleam00/Archon(L3 同层、Runtime-Configuration Factory 子层,与本仓库正交)、SaehwanPark/meta-harness(同概念 Codex 端口)、affaan-m/ECC(L2 跨 harness 标准化层)、wshobson/agents(角色/skill 目录,182 agents + 149 skills,可作为零件库供本仓库选用)、LangChain LangGraph(不同赛道)。这种把自己钉死在生态某个具体子层、并显式说明「与谁组合、与谁互斥」的做法在 OSS 里很罕见。

来源:README Coexistence — Harness and Neighbors 表
A/B 实验论文 + 100 个生成实例

姊妹仓库 revfactory/claude-code-harness 跑了 15 个软件工程任务的对照实验:有 harness vs 无 harness 平均质量 79.3 vs 49.5 (+60%)、15/15 win rate、-32% 输出方差;任务复杂度越高提升越大(Basic +23.8、Advanced +29.6、Expert +36.2)。论文 Hwang, M. (2026). *Harness: Structured Pre-Configuration for Enhancing LLM Code Agent Output Quality*。配套 revfactory/harness-100 提供 10 个领域 EN+KO 共 200 个 production-ready 团队包(1808 markdown 文件),同时作为实例库和压力测试。

来源:README Research / Built with Harness 节、revfactory/claude-code-harness 链接、论文标题

技术架构

仓库本体规模很小——44 个文件 4 个目录——但密度极高。.claude-plugin/ 放 plugin.json + marketplace.json 走 Claude Code 标准插件分发;skills/harness/SKILL.md 是 443 行的 meta-skill 主体,按 6 Phase 把工作流写到字段级别(每 Phase 列必须读取的现有文件、必须输出的产物、与下一 Phase 的契约),references/{agent-design-patterns, orchestrator-template, team-examples, skill-writing-guide, skill-testing-guide, qa-agent-guide}.md 6 份外置长尾把架构模式细节、模板、5 个真实例子、QA 集成等内容分离出去,保持主 SKILL.md 可读。docs/ 只放 quickstart.md 与 experimental-dependency.md(说明依赖的 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 实验 flag);_workspace/ 留有 4 个 agent role 临时文件 + release/ 审计记录(如 audit-2026-04-18.md 详记版本号 plugin.json/marketplace.json/README 三处不一致并归一)。index.html / privacy.html 是 GitHub Pages 落地页。整体设计判断:harness 把自己定位成「方法论压缩到一个 SKILL.md 加 6 个 references」这种纯文件交付,没有可执行代码——既符合 Claude Code Plugin 规范,也意味着「逻辑全在 prompt」,正确性靠模型对 SKILL.md 指令的执行力。CLAUDE.md 只存 pointer 不存 agent/skill 列表这条 v1.2.0 改进(CHANGELOG 详记),把单一真理源放在 .claude/agents/ 与 .claude/skills/ 与 orchestrator skill 三处,避免再增加一份会漂移的副本。

来源:完整 tree(44 文件)+ skills/harness/SKILL.md 443 行 + CHANGELOG.md v1.2.0/v1.2.1 + .claude-plugin/{plugin.json, marketplace.json}

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) Anthropic Claude Code Agent Teams(实验功能)— TeamCreate / SendMessage / TaskCreate 三件套,决定本插件的执行底座Anthropic Clau… Claude Code Plugin Marketplace — 分发协议Claude Code Pl… Claude Code Skills 系统 — 生成产物消费方Claude Code Sk… 无 npm / pip / Cargo 依赖——纯 Markdown 工作流无 npm / pip /… 6 种团队架构模式作为可枚举的设计语言6 种团队架构模式作为… 6-Phase 工作流:从领域一句话到 .claude/ 落盘6-Phase 工作流:从领… 三种执行模式 + Hybrid(v1.2.0 新增)三种执行模式 + Hybri… Harness Evolution Mechanism(自我进化)Harness Evolution M… 三语 README + 三语触发词 + Claude Code 插件市场分发三语 README + 三语触… Coexistence 生态自我定位(L3 Meta-Factory)Coexistence 生态自我… A/B 实验论文 + 100 个生成实例A/B 实验论文 + 100… harness 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言纯 Markdown + JSON 元数据(GitHub language 标签显示为 HTML,仅因 index.html / privacy.html 存在)框架Claude Code Plugin(.claude-plugin/plugin.json + marketplace.json 规范)+ SKILL.md 开放标准 + 实验级 Agent Teams API(CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
Anthropic Claude Code Agent Teams(实验…Claude Code Plugin MarketplaceClaude Code Skills 系统无 npm / pip / Cargo 依赖——纯 Markdown 工作流
用户侧两条安装路径:① /plugin marketplace add revfactory/harness && /plugin install harness@harness 走 Claude Code 内置插件市场;② cp -r skills/harness ~/.claude/skills/harness 全局 skill 直装。运行前必须开启实验 flag CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1(docs/experimental-dependency.md 单独说明)。无构建产物、无 CI(仓库 .github/ 仅含 issue/PR 模板,无 workflow)、无测试代码——meta-skill 正确性靠真实使用反馈与 A/B 实验
来源:README Installation / Requirements 节 + .claude-plugin/{plugin.json, marketplace.json} + docs/experimental-dependency.md + tree(无 package.json / pyproject.toml)

快速上手

# 前置:开启 Claude Code 实验级 Agent Teams export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 # 路径 A(推荐):通过 Claude Code 插件市场 /plugin marketplace add revfactory/harness /plugin install harness@harness # 路径 B:直接放进全局 skill 目录 cp -r skills/harness ~/.claude/skills/harness # 装好后直接在 Claude Code 对话框里说: Build a harness for this project Design an agent team for this domain Set up a harness # 或者中文 / 韩文 / 日文: 하네스 구성해줘 ハーネスを構成して # harness 会自动跑 Phase 0 审计 → Phase 1-6 一次落地: # .claude/agents/*.md # .claude/skills/*/SKILL.md # 后续在真实项目里使用后想把改进反馈回 factory: /harness:evolve
来源:README Installation / Usage / Harness Evolution Mechanism 节

使用场景

1. 个人开发者要把 Claude Code 用到非典型领域(不只是 coding——可能是 Webtoon 制作、YouTube 内容规划、营销活动、深度研究),借 harness 一句话拉起 4-5 个专业 Agent + 配套 skill;2. 团队规范化「Claude Code 项目骨架」——让所有新项目通过 `/harness:build` 落到统一的 .claude/agents/ + .claude/skills/ 结构上,避免每人手写各自风格的 SKILL.md;3. 评估某个领域适合用 6 种团队架构里的哪一种——直接读 references/agent-design-patterns.md 把 Pipeline / Fan-out / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation 的适用场景拿来对照;4. 研究 / 教学场景把 harness 当成「多 Agent 系统设计教材」——它的 6 模式分类和 6 Phase 工作流可以直接迁移到非 Claude Code 的 Agent 框架(LangGraph、AutoGen 等)做对比分析。

来源:README Use Cases — Try These Prompts 8 个示例 + Coexistence 表

优势与局限

优势

  • 方法论密度极高:把 meta-skill 压成一个 SKILL.md(443 行)+ 6 份 references 把 6 种架构模式与 6-Phase 工作流写到字段级,做到「读完就能落地」——这是同类「让 AI 生成 Agent 团队」工具里最完整的方法论交付(skills/harness/SKILL.md + references/)
  • Phase 0「先审计后生成」+ CLAUDE.md「只放 pointer」是真有产线纪律:避免重复生成覆盖现有配置,单一真理源放在 .claude/agents/ 与 .claude/skills/,CLAUDE.md 只记触发规则 + 变更日志——v1.2.0 专门改这条(CHANGELOG.md 详记)
  • 6 种团队架构模式直接搬自分布式系统词汇(Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation):这套语言可枚举、可对比、可教学,远比「让 AI 自由决定 Agent 关系」的黑箱方式更工程化
  • 生态自我定位与同行对比写得罕见的清晰:Coexistence 表把 Archon / meta-harness / ECC / wshobson/agents / LangGraph 5 个邻居用「他们是…,harness 是…」并列说明,给用户做选型决策的成本几乎为零
  • 证据链摆在台面:A/B 实验论文(Hwang, M. 2026)公开 + 数字(49.5 → 79.3 / 15/15 / -32%)+ 显式标注 n=15 / 作者自测 / 第三方复现仍未做 + 100 个生成实例库 revfactory/harness-100(10 领域 × 双语 = 200 包、1808 文件);CHANGELOG.md 也诚实记录了版本号 3 处不一致并归一
  • 三语 README + 三语 SKILL trigger(EN/KO/JA):在韩日开发者社区原生友好,触发短语关键词工程到位
  • Harness Evolution Mechanism 把「factory 自己学习」做成显式机制:用 `/harness:evolve` 捕获 shipped vs initial 的 delta 回写——是 meta-skill 真正闭环的少数实现样本

局限

  • 可测试性风险(最关键的一条):meta-skill 正确性几乎无法机器化验证——仓库无 CI workflow、无单元测试、无 lint,SKILL.md 443 行的「Phase 必读 / 必出」约束完全依赖模型对 prompt 的执行力;skill-testing-guide.md 给方法论但不给可执行测试代码——下游用户每次升级 harness 都得手动重跑 use case 验证
  • 稳定性 + 上游依赖风险:硬依赖 Claude Code 的 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 实验 flag(docs/experimental-dependency.md 单独警告);Anthropic 修改 TeamCreate / SendMessage / TaskCreate API 或废弃实验功能,harness 需要完整重写——Anthropic 没有给实验功能任何稳定承诺
  • 证据强度有边界:+60% 平均质量 / 15/15 win rate / -32% 方差这些数字基于 n=15 自测试、作者本人测量、第三方未复现——README 每次引用都加同一句话作免责声明,但传播过程中会被掐头去尾;任务复杂度提升幅度(Basic +23.8 → Expert +36.2)是有趣发现但样本量限制下不足以做泛化
  • 可扩展性局限:6 种架构模式是 hard-coded 在 references/agent-design-patterns.md 里,新模式需要修主仓 PR;用户在自己仓库扩 7-8 个模式需要 fork。Phase 选择矩阵(CHANGELOG 详记)也是 hard-coded,复杂度增长后需要更动态的策略选择器
  • 运营纪律弱于设计纪律:5 个 GitHub Releases tag 一个都没有(API 返回空),版本号靠 plugin.json + CHANGELOG 自维护;v1.2.1 CHANGELOG 自己曝出 README/marketplace.json/plugin.json 三处版本号不一致(已修),说明发版校验靠人工——下游 fork 维护者会复制这套问题
  • 国际化覆盖虽广但深度不均:SKILL.md frontmatter description 是韩文为主,主体 SKILL.md 内容也是韩文;README 三语但 docs/ 与 references/ 大多单语——非韩文用户在深度排查 Phase 行为时仍需依赖翻译
  • 适用边界写得不算清晰:6 模式都偏「多 Agent 协作」前提,对单 Agent 长任务、状态机型工作流(LangGraph 类)只能在 Coexistence 表里推到邻居赛道——用户拿到 harness 后可能仍要自己判断「我这件事真的需要团队吗」
来源:综合 README + skills/harness/SKILL.md + CHANGELOG.md + docs/experimental-dependency.md + 论文题目

最新版本

v1.2.1(2026-04-18,CHANGELOG.md 顶部)。注意:GitHub Releases 接口返回 0 条 tagged release——README 顶部徽章 + plugin.json + marketplace.json 三处版本号在 v1.2.0 时点曾经分别是 1.0.1 / 1.2.0 / 1.1.0,v1.2.1 CHANGELOG 显式记录该不一致并归一为 1.2.0 / 1.2.1(plugin.json 当前 1.2.0 / CHANGELOG 当前 1.2.1)。版本管理走 plugin.json + CHANGELOG.md 双轨,不走 GitHub Releases。

来源:GitHub Releases API(count=0)+ CHANGELOG.md 顶部 + .claude-plugin/plugin.json version 字段

总结评价

harness 是当前「让一句话生成 Claude Code Agent 团队」这条赛道里方法论密度与生态自我定位都做得最好的开源 meta-skill:6 种架构模式 + 6-Phase 工作流 + Phase 0 审计 + CLAUDE.md 只放 pointer + Harness Evolution Mechanism——产线纪律罕见地完整;100 个实例库 + A/B 论文做支撑;Coexistence 表把和 Archon / wshobson/agents / LangGraph 等邻居的关系说得清清楚楚。务实建议:1) 装之前先确认 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 在你的 Claude Code 版本里仍然有效——这是它的硬依赖,docs/experimental-dependency.md 单独提醒;2) 引用「+60% 质量提升」时务必带上完整免责(n=15 / 作者自测 / 第三方复现仍未做),不要拿头条数字单独跑分;3) 第一次用先在小项目跑 Phase 0+1+2 看产出再决定是不是继续 3-6,meta-skill 一旦走完 6 个 Phase 会在 .claude/ 下落很多文件——审计成本不低;4) 想扩第 7 种架构模式或新 IM 平台 Bot 等领域适配,目前需 fork 改 references/agent-design-patterns.md 主仓;5) 把 harness 当成方法论教材读也有价值——6 模式分类与 6-Phase 工作流可迁移到 LangGraph / AutoGen 等非 Claude Code 的 Agent 框架做对比设计;6) 与 Archon 不互斥:Archon 处理 runtime config 确定性,harness 处理 team 架构设计,README 自己也建议组合使用(用 harness 设计架构 → 用 Archon 部署 runtime)。

来源:综合分析
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-14 10:23. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件