mini-swe-agent(mini)是一个「100 行」的极简 AI 软件工程智能体,用来解决 GitHub issue 或在命令行里帮你干活。它由打造 SWE-bench 与 SWE-agent 的普林斯顿/斯坦福团队出品,核心主张是:当语言模型变强后,复杂的工具与脚手架其实大多不必要——mini 只用 bash、不用工具调用接口、历史完全线性、用 subprocess.run 执行动作,却仍在 SWE-bench verified 上拿到 >74% 的成绩,且启动比 Claude Code 快得多。许可为 MIT,Python,约 4,477 stars,被 Meta、NVIDIA、IBM、普林斯顿、斯坦福等广泛采用(当前为 v2)。
来源:README.md(标题、首段、minimal/performant 列表、v2 提示);GitHub 仓库元数据(stars=4477、license=MIT、language=Python) 查看 GitHub 仓库 →在「智能体脚手架越堆越重」的当下,mini 反其道而行:用约 100 行 Python、只靠 bash,就在 SWE-bench verified 上达到 >74%,证明随着 LM 变强,把注意力放在模型而非脚手架上同样有效。它来自 SWE-bench/SWE-agent 原班团队、被众多大厂与名校采用,并作为「bash only」排行榜评测不同 LM 的基线,理念鲜明、实用,因而受关注。截至数据采集约 4,477 stars。
来源:README.md(首段、widely adopted、performant、SWE-bench bash only);GitHub 仓库元数据(stars=4477)核心 agent 约 100 行 Python,除 bash 外无任何工具、不用工具调用接口,可配任意模型,沙箱里无需装包。
来源:README.md(minimal、Does not have any tools)每步只往消息追加(轨迹即消息,利于调试/微调);用 subprocess.run 执行独立动作,换成 docker exec 即可沙箱化与扩展。
来源:README.md(Has a completely linear history、Executes actions with subprocess.run)在 SWE-bench verified 上 >74%,启动比 Claude Code 快得多,并作为「bash only」排行榜评测不同 LM 的基线。
来源:README.md(performant、SWE-bench bash only)支持本地、docker/podman、singularity/apptainer、bubblewrap 等部署;经 litellm/openrouter/portkey 兼容几乎所有模型。
来源:README.md(Deployable、Compatible)mini 的极简体现在三点:① 除 bash 外没有任何工具——甚至不用 LM 的工具调用接口,因此可配任意模型,沙箱里也无需安装任何包;② 历史完全线性——每一步只是往消息列表追加,轨迹即传给 LM 的消息,便于调试与微调;③ 用 subprocess.run 执行动作——每个动作完全独立(不保持有状态 shell 会话),把 run 换成 docker exec 即可在沙箱执行、轻松扩展。核心 agent 类约 100 行(default.py),外加环境(local.py)、模型(litellm_model.py)、运行脚本等少量代码。部署支持本地、docker/podman、singularity/apptainer、bubblewrap 等;模型经 litellm/openrouter/portkey 等支持几乎所有 LM,含 /completion 与 /response 端点、交错思考等。
来源:README.md(agent 类链接、minimal、Does not have any tools/linear history/subprocess.run、Deployable/Compatible)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
litellm/openrouter/portkey(模型接入)bashdocker/podman/singularity 等(沙箱,可选)适合想要一个简单、可理解、可魔改的 SWE 智能体的开发者与研究者:解决 GitHub issue、在命令行里辅助开发任务;用作评测不同 LM 编码能力的「干净基线」(bash only);在沙箱中大规模批量跑、做调试与微调(线性历史);或作为学习「最小可用智能体怎么搭」的范本。它把语言模型而非脚手架放在中心,适合追求简单与可控的场景。
来源:README.md(标题、首段、Simple/Convenient/Flexible、SWE-bench bash only)当前为 mini-swe-agent v2(旧版在 v1 分支,提供迁移指南)。近期动态包括在更具挑战的 ProgramBench 上运行、Gemini 3 Pro 用 mini 达到 74% SWE-bench verified、以及关于随机切换 GPT-5/Sonnet 提升表现的实验等。它持续作为评测 LM 编码能力的极简基线。
来源:README.md(顶部公告、v2 提示、performant)mini-swe-agent 是「少即是多」的有力证明:约 100 行 Python、只用 bash、历史线性、动作独立,却在 SWE-bench verified 上 >74%,还能配任意模型、轻松沙箱化与扩展,出自 SWE-bench/SWE-agent 原班团队、被大厂名校广泛采用。对想要简单可理解、可魔改的 SWE 智能体,或想要一个干净的 LM 编码评测基线的人非常合适。要清楚它的极简取舍(无专用工具、效果依赖模型、v2 有迁移成本)。作为最小可用 SWE 智能体,它思路清晰、实用、影响力大。
来源:综合 README.md 的极简设计、性能与团队背景