harness 深度解析：架构、场景与部署指南（8K★）

为什么值得关注

2026 上半年 Claude Code 的 Agent Teams 与 Skills 系统进入实验功能（`CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1`），社区开始大量造「meta-skill」——让一句话把多 Agent 的角色分工 + 协作协议 + 验证流程一次写完。harness 是这条赛道里把方法论做得最透的一个：把团队协作抽象成 6 个有古典分布式系统血统的架构模式（Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation），按 6-Phase 工作流（Audit / Domain Analysis / Team Design / Agent Gen / Skill Gen / Orchestration / Validation）依次落地，每个阶段都有 references/*.md 模板兜底；附带 100 个已生成的 production-ready 团队仓库 `revfactory/harness-100`（10 个领域 EN + KO 200 个包、1808 文件）作为实例库；A/B 实验论文 + 显式标注 n=15 / 作者自测 / 第三方复现仍未做。结果是 6 周 3345★ / 505 fork，与 Archon（runtime-config 工厂）、wshobson/agents（角色目录）等邻居形成清晰的「同层异职」生态。

来源：README Overview / Workflow / Star History / Built with Harness / Research / Coexistence 节

核心功能

6 种团队架构模式作为可枚举的设计语言

Pipeline（顺序依赖任务）、Fan-out/Fan-in（并行无依赖任务后汇总）、Expert Pool（按上下文选择性调用领域专家）、Producer-Reviewer（生成后评审闭环）、Supervisor（中心 Agent 动态分发任务）、Hierarchical Delegation（自上而下递归委派）。这套词汇直接搬自分布式系统/微服务体系，给「多 Agent 协作」提供了可枚举、可对比、可教学的设计空间。具体细节在 skills/harness/references/agent-design-patterns.md。

来源：README Architecture Patterns 表、skills/harness/references/agent-design-patterns.md

6-Phase 工作流：从领域一句话到 .claude/ 落盘

Phase 0 现状审计（读 .claude/agents/ / .claude/skills/ / CLAUDE.md 检测 drift）→ Phase 1 领域分析 + 用户技术水平识别 → Phase 2 团队架构设计（Agent Teams / Subagents / Hybrid 三选一 + 6 模式之一）→ Phase 3 生成 agent 定义文件 → Phase 4 生成 skill 文件（Progressive Disclosure）→ Phase 5 集成与编排（CLAUDE.md 只放 pointer 不放重复列表）→ Phase 6 验证与测试（trigger 验证 + dry-run + 有/无 Skill 对比）。Phase 0 让 harness 可重复执行不会推翻已有配置——这是它与一次性 scaffold 工具的关键区别。

来源：skills/harness/SKILL.md（443 行，6-Phase 工作流）、README Workflow 节

三种执行模式 + Hybrid（v1.2.0 新增）

默认 Agent Teams 模式（TeamCreate + SendMessage + TaskCreate，2+ Agent 协作场景），可选 Subagents 模式（Agent 工具直调，一次性任务无需互相通信），v1.2.0 新增 Hybrid 模式（按 Phase 混合：例如 Phase 3 用 Subagents 并行收集 → Phase 5 用 Team 合议通过）。CHANGELOG 显式列出常见组合（并行收集→合议、团队生成→验证、Phase 间团队重组）。

来源：README Execution Modes 表 + CHANGELOG.md v1.2.0 Phase 2-1 Hybrid 模式

Harness Evolution Mechanism（自我进化）

harness 把生成出来的初始团队当作「初稿」，鼓励用户在真实项目里继续打磨；当 shipped 团队稳定后跑 `/harness:evolve`，捕获「初始 → shipped」的 delta（哪些角色被合并 / 哪些 skill 被拆出 / 哪些消息协议被改写），把 delta 反馈回 factory 让下一次同领域生成从 shipped 状态附近开始。README 用一张闭环箭头图说明这套机制（KR 하네스 진화 메커니즘 / JA ハーネス進化メカニズム）。

来源：README Harness Evolution Mechanism 节

三语 README + 三语触发词 + Claude Code 插件市场分发

README.md（EN）、README_KO.md、README_JA.md 同步维护，对应触发词三语化：'build a harness for this project' / '하네스 구성해줘' / 'ハーネスを構成して'，SKILL.md frontmatter description 也是韩文 + 多触发短语关键词工程。分发走 Claude Code Plugin Marketplace 标准两步（`/plugin marketplace add revfactory/harness` + `/plugin install harness@harness`），也支持直接 cp 到 ~/.claude/skills/harness/。.claude-plugin/plugin.json 把 keywords 扩到 17 个覆盖 6 个模式名 + harness-factory + multi-agent + agent-scaffolding。

来源：README 三语 + skills/harness/SKILL.md frontmatter + .claude-plugin/{plugin.json, marketplace.json}

Coexistence 生态自我定位（L3 Meta-Factory）

README 专门一节用「X is …, Harness is …」并排对比 5 个邻居仓库：coleam00/Archon（L3 同层、Runtime-Configuration Factory 子层，与本仓库正交）、SaehwanPark/meta-harness（同概念 Codex 端口）、affaan-m/ECC（L2 跨 harness 标准化层）、wshobson/agents（角色/skill 目录，182 agents + 149 skills，可作为零件库供本仓库选用）、LangChain LangGraph（不同赛道）。这种把自己钉死在生态某个具体子层、并显式说明「与谁组合、与谁互斥」的做法在 OSS 里很罕见。

来源：README Coexistence — Harness and Neighbors 表

A/B 实验论文 + 100 个生成实例

姊妹仓库 revfactory/claude-code-harness 跑了 15 个软件工程任务的对照实验：有 harness vs 无 harness 平均质量 79.3 vs 49.5 (+60%)、15/15 win rate、-32% 输出方差；任务复杂度越高提升越大（Basic +23.8、Advanced +29.6、Expert +36.2）。论文 Hwang, M. (2026). *Harness: Structured Pre-Configuration for Enhancing LLM Code Agent Output Quality*。配套 revfactory/harness-100 提供 10 个领域 EN+KO 共 200 个 production-ready 团队包（1808 markdown 文件），同时作为实例库和压力测试。

来源：README Research / Built with Harness 节、revfactory/claude-code-harness 链接、论文标题

技术架构

仓库本体规模很小——44 个文件 4 个目录——但密度极高。.claude-plugin/ 放 plugin.json + marketplace.json 走 Claude Code 标准插件分发；skills/harness/SKILL.md 是 443 行的 meta-skill 主体，按 6 Phase 把工作流写到字段级别（每 Phase 列必须读取的现有文件、必须输出的产物、与下一 Phase 的契约），references/{agent-design-patterns, orchestrator-template, team-examples, skill-writing-guide, skill-testing-guide, qa-agent-guide}.md 6 份外置长尾把架构模式细节、模板、5 个真实例子、QA 集成等内容分离出去，保持主 SKILL.md 可读。docs/ 只放 quickstart.md 与 experimental-dependency.md（说明依赖的 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 实验 flag）；_workspace/ 留有 4 个 agent role 临时文件 + release/ 审计记录（如 audit-2026-04-18.md 详记版本号 plugin.json/marketplace.json/README 三处不一致并归一）。index.html / privacy.html 是 GitHub Pages 落地页。整体设计判断：harness 把自己定位成「方法论压缩到一个 SKILL.md 加 6 个 references」这种纯文件交付，没有可执行代码——既符合 Claude Code Plugin 规范，也意味着「逻辑全在 prompt」，正确性靠模型对 SKILL.md 指令的执行力。CLAUDE.md 只存 pointer 不存 agent/skill 列表这条 v1.2.0 改进（CHANGELOG 详记），把单一真理源放在 .claude/agents/ 与 .claude/skills/ 与 orchestrator skill 三处，避免再增加一份会漂移的副本。

来源：完整 tree（44 文件）+ skills/harness/SKILL.md 443 行 + CHANGELOG.md v1.2.0/v1.2.1 + .claude-plugin/{plugin.json, marketplace.json}

项目知识图谱

中心为项目本体，内环 = 核心功能模块，外环 = 关键技术依赖；按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言纯 Markdown + JSON 元数据（GitHub language 标签显示为 HTML，仅因 index.html / privacy.html 存在）框架Claude Code Plugin（.claude-plugin/plugin.json + marketplace.json 规范）+ SKILL.md 开放标准 + 实验级 Agent Teams API（CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1）

关键依赖

Anthropic Claude Code Agent Teams（实验…Claude Code Plugin MarketplaceClaude Code Skills 系统无 npm / pip / Cargo 依赖——纯 Markdown 工作流

基础设施 / 部署

用户侧两条安装路径：① /plugin marketplace add revfactory/harness && /plugin install harness@harness 走 Claude Code 内置插件市场；② cp -r skills/harness ~/.claude/skills/harness 全局 skill 直装。运行前必须开启实验 flag CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1（docs/experimental-dependency.md 单独说明）。无构建产物、无 CI（仓库 .github/ 仅含 issue/PR 模板，无 workflow）、无测试代码——meta-skill 正确性靠真实使用反馈与 A/B 实验

来源：README Installation / Requirements 节 + .claude-plugin/{plugin.json, marketplace.json} + docs/experimental-dependency.md + tree（无 package.json / pyproject.toml）

快速上手

# 前置：开启 Claude Code 实验级 Agent Teams export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 # 路径 A（推荐）：通过 Claude Code 插件市场 /plugin marketplace add revfactory/harness /plugin install harness@harness # 路径 B：直接放进全局 skill 目录 cp -r skills/harness ~/.claude/skills/harness # 装好后直接在 Claude Code 对话框里说： Build a harness for this project Design an agent team for this domain Set up a harness # 或者中文 / 韩文 / 日文： 하네스 구성해줘 ハーネスを構成して # harness 会自动跑 Phase 0 审计 → Phase 1-6 一次落地： # .claude/agents/*.md # .claude/skills/*/SKILL.md # 后续在真实项目里使用后想把改进反馈回 factory： /harness:evolve

来源：README Installation / Usage / Harness Evolution Mechanism 节

使用场景

1. 个人开发者要把 Claude Code 用到非典型领域（不只是 coding——可能是 Webtoon 制作、YouTube 内容规划、营销活动、深度研究），借 harness 一句话拉起 4-5 个专业 Agent + 配套 skill；2. 团队规范化「Claude Code 项目骨架」——让所有新项目通过 `/harness:build` 落到统一的 .claude/agents/ + .claude/skills/ 结构上，避免每人手写各自风格的 SKILL.md；3. 评估某个领域适合用 6 种团队架构里的哪一种——直接读 references/agent-design-patterns.md 把 Pipeline / Fan-out / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation 的适用场景拿来对照；4. 研究 / 教学场景把 harness 当成「多 Agent 系统设计教材」——它的 6 模式分类和 6 Phase 工作流可以直接迁移到非 Claude Code 的 Agent 框架（LangGraph、AutoGen 等）做对比分析。

来源：README Use Cases — Try These Prompts 8 个示例 + Coexistence 表

优势与局限

优势

方法论密度极高：把 meta-skill 压成一个 SKILL.md（443 行）+ 6 份 references 把 6 种架构模式与 6-Phase 工作流写到字段级，做到「读完就能落地」——这是同类「让 AI 生成 Agent 团队」工具里最完整的方法论交付（skills/harness/SKILL.md + references/）
Phase 0「先审计后生成」+ CLAUDE.md「只放 pointer」是真有产线纪律：避免重复生成覆盖现有配置，单一真理源放在 .claude/agents/ 与 .claude/skills/，CLAUDE.md 只记触发规则 + 变更日志——v1.2.0 专门改这条（CHANGELOG.md 详记）
6 种团队架构模式直接搬自分布式系统词汇（Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical Delegation）：这套语言可枚举、可对比、可教学，远比「让 AI 自由决定 Agent 关系」的黑箱方式更工程化
生态自我定位与同行对比写得罕见的清晰：Coexistence 表把 Archon / meta-harness / ECC / wshobson/agents / LangGraph 5 个邻居用「他们是…，harness 是…」并列说明，给用户做选型决策的成本几乎为零
证据链摆在台面：A/B 实验论文（Hwang, M. 2026）公开 + 数字（49.5 → 79.3 / 15/15 / -32%）+ 显式标注 n=15 / 作者自测 / 第三方复现仍未做 + 100 个生成实例库 revfactory/harness-100（10 领域 × 双语 = 200 包、1808 文件）；CHANGELOG.md 也诚实记录了版本号 3 处不一致并归一
三语 README + 三语 SKILL trigger（EN/KO/JA）：在韩日开发者社区原生友好，触发短语关键词工程到位
Harness Evolution Mechanism 把「factory 自己学习」做成显式机制：用 `/harness:evolve` 捕获 shipped vs initial 的 delta 回写——是 meta-skill 真正闭环的少数实现样本

局限

可测试性风险（最关键的一条）：meta-skill 正确性几乎无法机器化验证——仓库无 CI workflow、无单元测试、无 lint，SKILL.md 443 行的「Phase 必读 / 必出」约束完全依赖模型对 prompt 的执行力；skill-testing-guide.md 给方法论但不给可执行测试代码——下游用户每次升级 harness 都得手动重跑 use case 验证
稳定性 + 上游依赖风险：硬依赖 Claude Code 的 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 实验 flag（docs/experimental-dependency.md 单独警告）；Anthropic 修改 TeamCreate / SendMessage / TaskCreate API 或废弃实验功能，harness 需要完整重写——Anthropic 没有给实验功能任何稳定承诺
证据强度有边界：+60% 平均质量 / 15/15 win rate / -32% 方差这些数字基于 n=15 自测试、作者本人测量、第三方未复现——README 每次引用都加同一句话作免责声明，但传播过程中会被掐头去尾；任务复杂度提升幅度（Basic +23.8 → Expert +36.2）是有趣发现但样本量限制下不足以做泛化
可扩展性局限：6 种架构模式是 hard-coded 在 references/agent-design-patterns.md 里，新模式需要修主仓 PR；用户在自己仓库扩 7-8 个模式需要 fork。Phase 选择矩阵（CHANGELOG 详记）也是 hard-coded，复杂度增长后需要更动态的策略选择器
运营纪律弱于设计纪律：5 个 GitHub Releases tag 一个都没有（API 返回空），版本号靠 plugin.json + CHANGELOG 自维护；v1.2.1 CHANGELOG 自己曝出 README/marketplace.json/plugin.json 三处版本号不一致（已修），说明发版校验靠人工——下游 fork 维护者会复制这套问题
国际化覆盖虽广但深度不均：SKILL.md frontmatter description 是韩文为主，主体 SKILL.md 内容也是韩文；README 三语但 docs/ 与 references/ 大多单语——非韩文用户在深度排查 Phase 行为时仍需依赖翻译
适用边界写得不算清晰：6 模式都偏「多 Agent 协作」前提，对单 Agent 长任务、状态机型工作流（LangGraph 类）只能在 Coexistence 表里推到邻居赛道——用户拿到 harness 后可能仍要自己判断「我这件事真的需要团队吗」

来源：综合 README + skills/harness/SKILL.md + CHANGELOG.md + docs/experimental-dependency.md + 论文题目

总结评价

harness 是当前「让一句话生成 Claude Code Agent 团队」这条赛道里方法论密度与生态自我定位都做得最好的开源 meta-skill：6 种架构模式 + 6-Phase 工作流 + Phase 0 审计 + CLAUDE.md 只放 pointer + Harness Evolution Mechanism——产线纪律罕见地完整；100 个实例库 + A/B 论文做支撑；Coexistence 表把和 Archon / wshobson/agents / LangGraph 等邻居的关系说得清清楚楚。务实建议：1) 装之前先确认 `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` 在你的 Claude Code 版本里仍然有效——这是它的硬依赖，docs/experimental-dependency.md 单独提醒；2) 引用「+60% 质量提升」时务必带上完整免责（n=15 / 作者自测 / 第三方复现仍未做），不要拿头条数字单独跑分；3) 第一次用先在小项目跑 Phase 0+1+2 看产出再决定是不是继续 3-6，meta-skill 一旦走完 6 个 Phase 会在 .claude/ 下落很多文件——审计成本不低；4) 想扩第 7 种架构模式或新 IM 平台 Bot 等领域适配，目前需 fork 改 references/agent-design-patterns.md 主仓；5) 把 harness 当成方法论教材读也有价值——6 模式分类与 6-Phase 工作流可迁移到 LangGraph / AutoGen 等非 Claude Code 的 Agent 框架做对比设计；6) 与 Archon 不互斥：Archon 处理 runtime config 确定性，harness 处理 team 架构设计，README 自己也建议组合使用（用 harness 设计架构 → 用 Archon 部署 runtime）。

来源：综合分析

常见问题

harness 是什么？

harness 是 revfactory 为 Claude Code 做的元技能（meta-skill）插件——一句「build a harness for this project」自动把领域描述转成 Agent Team 加配套 Skill 文件，按 Pipeline / Fan-out-Fan-in / Expert Pool / Producer-Reviewer / Supervisor / Hierarchical…

harness 有哪些核心功能？

harness 的核心功能包括：6 种团队架构模式作为可枚举的设计语言、6-Phase 工作流：从领域一句话到 .claude/ 落盘、三种执行模式 + Hybrid（v1.2.0 新增）、Harness Evolution Mechanism（自我进化）、三语 README + 三语触发词 + Claude Code 插件市场分发。

harness 为什么最近很受关注？

2026 上半年 Claude Code 的 Agent Teams 与 Skills 系统进入实验功能（`CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1`），社区开始大量造「meta-skill」——让一句话把多 Agent 的角色分工 + 协作协议 + 验证流程一次写完。

harness 适合哪些使用场景？

1. 个人开发者要把 Claude Code 用到非典型领域（不只是 coding——可能是 Webtoon 制作、YouTube 内容规划、营销活动、深度研究），借 harness 一句话拉起 4-5 个专业 Agent + 配套 skill；2.

透明度声明
本页内容由 AI（大语言模型）基于以下公开材料自动生成：GitHub README、代码目录结构、依赖文件、Release 信息。分析时间: 2026-05-14 10:23. 质量评分: 100/100.

数据来源：README、GitHub API、依赖文件