前端开发平台vercel正式发布agent browser——一款面向ai代理的浏览器自动化命令行工具(cli),首次实现让大模型“不仅能理解网页内容,更能直接操控页面”的突破性能力。
Agent Browser的核心优势在于极简上手体验:无需手动部署浏览器驱动,也无需配置繁琐的运行环境,真正做到开箱即用。
开发者仅需执行几条简洁命令,即可驱动AI代理与真实网页进行深度交互。该工具提供双模式运行支持——既支持在带图形界面的浏览器中实时调试,直观追踪AI操作逻辑;也可切换至无头模式后台静默运行,高效完成批量任务,广泛适用于自动化测试、结构化数据抓取及端到端业务流程自动化等场景。

针对传统自动化框架(如Playwright)在对接AI时普遍存在上下文信息冗余、有效信息密度低、推理负担重等瓶颈,Agent Browser进行了针对性重构。其序列化数据结构经过高度裁剪,可剔除高达93%的非关键信息,仅保留核心DOM节点与可交互元素,显著提升AI的理解效率与操作精准度。
此外,工具底层由Rust语言构建,在启动速度、内存占用及运行稳定性方面全面优于基于Node.js或Python的传统方案。
Agent Browser目前已原生适配Claude Code、Gemini、Cursor、GitHub Copilot、Codex、opencode等主流AI编程助手,并可在任意支持Bash命令的操作系统上无缝运行。
源码地址:点击下载









