mini-swe-agent 是什么?

mini-swe-agent(mini)是一个「100 行」的极简 AI 软件工程智能体,用来解决 GitHub issue 或在命令行里帮你干活。它由打造 SWE-bench 与 SWE-agent 的普林斯顿/斯坦福团队出品,核心主张是:当语言模型变强后,复杂的工具与脚手架其实大多不必要——mini 只用 bash、不用工具调用接口、历史完全线性、用 subprocess.run 执行动作,却仍在 SWE-bench verified 上拿到 >74% 的成绩,且启动比 Claude Code 快得多。许可为 MIT,Python,约 4,477 stars,被 Meta、NVIDIA、IBM、普林斯顿、斯坦福等广泛采用(当前为 v2)。

⭐ 3,665 Stars 🍴 507 Forks Python MIT 作者: SWE-agent
来源:README.md(标题、首段、minimal/performant 列表、v2 提示);GitHub 仓库元数据(stars=4477、license=MIT、language=Python) 查看 GitHub 仓库 →

为什么值得关注

在「智能体脚手架越堆越重」的当下,mini 反其道而行:用约 100 行 Python、只靠 bash,就在 SWE-bench verified 上达到 >74%,证明随着 LM 变强,把注意力放在模型而非脚手架上同样有效。它来自 SWE-bench/SWE-agent 原班团队、被众多大厂与名校采用,并作为「bash only」排行榜评测不同 LM 的基线,理念鲜明、实用,因而受关注。截至数据采集约 4,477 stars。

来源:README.md(首段、widely adopted、performant、SWE-bench bash only);GitHub 仓库元数据(stars=4477)

核心功能

约 100 行、仅用 bash

核心 agent 约 100 行 Python,除 bash 外无任何工具、不用工具调用接口,可配任意模型,沙箱里无需装包。

来源:README.md(minimal、Does not have any tools)
线性历史 + 独立动作

每步只往消息追加(轨迹即消息,利于调试/微调);用 subprocess.run 执行独立动作,换成 docker exec 即可沙箱化与扩展。

来源:README.md(Has a completely linear history、Executes actions with subprocess.run)
高性能基线

在 SWE-bench verified 上 >74%,启动比 Claude Code 快得多,并作为「bash only」排行榜评测不同 LM 的基线。

来源:README.md(performant、SWE-bench bash only)
广泛部署与模型兼容

支持本地、docker/podman、singularity/apptainer、bubblewrap 等部署;经 litellm/openrouter/portkey 兼容几乎所有模型。

来源:README.md(Deployable、Compatible)

技术架构

mini 的极简体现在三点:① 除 bash 外没有任何工具——甚至不用 LM 的工具调用接口,因此可配任意模型,沙箱里也无需安装任何包;② 历史完全线性——每一步只是往消息列表追加,轨迹即传给 LM 的消息,便于调试与微调;③ 用 subprocess.run 执行动作——每个动作完全独立(不保持有状态 shell 会话),把 run 换成 docker exec 即可在沙箱执行、轻松扩展。核心 agent 类约 100 行(default.py),外加环境(local.py)、模型(litellm_model.py)、运行脚本等少量代码。部署支持本地、docker/podman、singularity/apptainer、bubblewrap 等;模型经 litellm/openrouter/portkey 等支持几乎所有 LM,含 /completion 与 /response 端点、交错思考等。

来源:README.md(agent 类链接、minimal、Does not have any tools/linear history/subprocess.run、Deployable/Compatible)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) litellm/openrouter/portkey(模型接入)litellm/openro… bash docker/podman/singularity 等(沙箱,可选)docker/podman/… 约 100 行、仅用 bash 线性历史 + 独立动作 高性能基线 广泛部署与模型兼容 mini-swe-agent 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python框架极简智能体(bash + subprocess.run,无工具调用)
litellm/openrouter/portkey(模型接入)bashdocker/podman/singularity 等(沙箱,可选)
本地/容器/沙箱多种部署;CLI 与 textual TUI
来源:README.md(Compatible、Deployable、model 链接、topics 含 textual);GitHub 仓库元数据(language=Python)

快速上手

按官方文档(mini-swe-agent.com)安装 mini-swe-agent(v2,注意看 v2 迁移指南,旧版在 v1 分支)。配置你选的模型(经 litellm/openrouter/portkey,用你自己的 key),即可在命令行让它解决 GitHub issue 或辅助日常开发;要在沙箱里跑就把执行环境切到 docker/podman/singularity/bubblewrap 等。因为只用 bash、动作独立,扩展与沙箱化都很简单。具体命令见官方文档与 run 脚本示例。
来源:README.md(v2 提示、Deployable、Compatible、首段)

使用场景

适合想要一个简单、可理解、可魔改的 SWE 智能体的开发者与研究者:解决 GitHub issue、在命令行里辅助开发任务;用作评测不同 LM 编码能力的「干净基线」(bash only);在沙箱中大规模批量跑、做调试与微调(线性历史);或作为学习「最小可用智能体怎么搭」的范本。它把语言模型而非脚手架放在中心,适合追求简单与可控的场景。

来源:README.md(标题、首段、Simple/Convenient/Flexible、SWE-bench bash only)

优势与局限

优势

  • 约 100 行、仅用 bash 却 >74% SWE-bench verified,极简且高效
  • 线性历史 + 独立动作,调试/微调/沙箱化都很简单
  • 兼容几乎所有模型、多种部署方式,启动快
  • 出自 SWE-bench/SWE-agent 原班团队,被大厂/名校广泛采用,MIT 开源

局限

  • 极简取舍:无专用工具,复杂特定操作靠让 LM 用 bash 自行解决
  • 效果高度依赖所用模型的能力
  • v1→v2 有迁移成本(看迁移指南)
  • 作为基线/可魔改工具,开箱产品化能力不如重型 Agent
来源:README.md(minimal、Does not have any tools、v2 提示、首段)

最新版本

当前为 mini-swe-agent v2(旧版在 v1 分支,提供迁移指南)。近期动态包括在更具挑战的 ProgramBench 上运行、Gemini 3 Pro 用 mini 达到 74% SWE-bench verified、以及关于随机切换 GPT-5/Sonnet 提升表现的实验等。它持续作为评测 LM 编码能力的极简基线。

来源:README.md(顶部公告、v2 提示、performant)

总结评价

mini-swe-agent 是「少即是多」的有力证明:约 100 行 Python、只用 bash、历史线性、动作独立,却在 SWE-bench verified 上 >74%,还能配任意模型、轻松沙箱化与扩展,出自 SWE-bench/SWE-agent 原班团队、被大厂名校广泛采用。对想要简单可理解、可魔改的 SWE 智能体,或想要一个干净的 LM 编码评测基线的人非常合适。要清楚它的极简取舍(无专用工具、效果依赖模型、v2 有迁移成本)。作为最小可用 SWE 智能体,它思路清晰、实用、影响力大。

来源:综合 README.md 的极简设计、性能与团队背景
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 14:09. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件