agent-browser 是 Vercel Labs 出品的浏览器自动化 CLI,专为 AI 智能体设计——一个快速的原生 Rust 命令行工具。它让智能体用简单命令驱动真实浏览器:打开页面、获取无障碍树(accessibility tree)快照并拿到元素引用、按引用点击/填写/取文本、截图等。与传统基于 Playwright/Puppeteer 的方案不同,它的守护进程不需要 Playwright 或 Node.js,直接用 Chrome for Testing(Google 官方自动化通道)。许可为 Apache-2.0,约 34,111 stars,提供 npm/Homebrew/Cargo 等多种安装方式。
来源:README.md(标题、首段、Requirements、Quick Start);GitHub 仓库元数据(stars=34111、license=Apache-2.0、language=Rust) 查看 GitHub 仓库 →让 AI 智能体可靠地操作浏览器是 Agent 落地的关键能力,但现有方案常依赖较重的 Node/Playwright 栈、且对 LLM 不够友好。agent-browser 的差异化在于:原生 Rust、快、守护进程零 Node 依赖,并以「无障碍树快照 + 元素引用(@e2 这类 ref)」的方式让智能体精准定位元素(也兼容传统选择器与按 role 查找),更契合 LLM 的工作方式。出自 Vercel Labs、定位清晰,因而获得高关注。截至数据采集约 34,111 stars。
来源:README.md(首段、Quick Start 的 snapshot/ref 用法、Requirements);GitHub 仓库元数据(owner=vercel-labs、stars=34111)snapshot 获取页面无障碍树并给每个元素分配引用(如 @e2),智能体按引用 click/fill/get text,定位精准、对 LLM 友好。
来源:README.md(Quick Start 的 snapshot/@e2 用法)快速的原生 Rust CLI,守护进程不需要 Playwright 或 Node.js,用 Chrome for Testing 官方自动化通道驱动浏览器。
来源:README.md(首段、Requirements)除元素引用外,也支持传统 CSS 选择器(click "#submit")和按角色查找(find role button click --name "Submit"),兼顾灵活与可读。
来源:README.md(Quick Start、Traditional Selectors)内置 doctor 自检/修复环境、Chrome、守护进程、网络与安全;安装支持 npm/Homebrew/Cargo/源码,upgrade 自动识别安装方式更新。
来源:README.md(Installation 各方式、Updating);git tree(cli/src/doctor/)它是一个原生 Rust CLI(cli/src 下含 commands、connection、native/actions、auth、doctor 等模块),通过 Chrome DevTools 类机制驱动浏览器;守护进程不需要 Playwright 或 Node.js。首次用 agent-browser install 从 Chrome for Testing 下载 Chrome(也会自动检测已有的 Chrome/Brave/Playwright/Puppeteer 安装)。核心交互范式是:open 打开页面→snapshot 获取带元素引用的无障碍树→用 @e2 这类 ref 做 click/fill/get text/screenshot;同时支持传统 CSS 选择器和按 role+name 查找(如 find role button click --name "Submit")。还内置 doctor 子命令做环境/Chrome/守护进程/网络/安全自检与修复。安装分发覆盖 npm、Homebrew、Cargo 与源码构建,并有 upgrade 自动识别安装方式更新。
来源:README.md(Quick Start、Traditional Selectors、Requirements、Updating);git tree(cli/src/commands.rs、native/actions.rs、doctor/ 各模块)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
Chrome for Testing(Google 官方自动化通道)可复用已有 Chrome/Brave/Playwright/Puppet…适合给 AI 智能体加上「操作浏览器」的能力:自动化网页任务(登录、填表、点击、抓取文本/截图)、做端到端测试、构建需要真实浏览器的 Agent 工作流,或在 CI/脚本里驱动浏览器。它的无障碍树 + 元素引用范式特别适合让 LLM 可靠地定位和操作页面元素;原生 Rust 与零 Node 守护进程也降低了部署负担。自动化网页时应遵守目标站的服务条款与 robots/反爬规定,并对登录凭证等敏感信息做好保护。
来源:README.md(首段、Quick Start、Requirements)本页未列出具体版本号;项目以原生 Rust CLI 形式维护,通过 npm/Homebrew/Cargo 多渠道发布,提供 agent-browser upgrade 自动识别安装方式更新。更新以完善浏览器自动化命令、元素定位、doctor 自检与跨平台支持为主。
来源:README.md(Updating、Installation);git tree(cli/src/)agent-browser 把「给 AI 智能体一双操作浏览器的手」做得很对路:原生 Rust、快、守护进程零 Node 依赖,并用无障碍树快照 + 元素引用让 LLM 能精准定位和操作页面,兼容传统选择器,出自 Vercel Labs、安装与自检都齐全。对要给 Agent 加浏览器自动化能力、或做端到端测试的开发者,它是轻量而现代的选择。要注意首次需下载 Chrome、复杂动态站点仍需调试,以及自动化他人站点的合规边界。作为面向 Agent 的浏览器自动化底座,它定位清晰、工程质量高。
来源:综合 README.md 的定位、交互范式与工程特性