
Alibaba PageAgent 开源项目解析:把网页界面变成可被自然语言控制的 GUI Agent
PageAgent 是 Alibaba 开源的 TypeScript 项目,主打在网页内部通过 JavaScript 操控界面,不依赖浏览器扩展、Python 或无头浏览器。它适合产品内 AI Copilot、表单自动填写、可访问性和 MCP 场景。
如果说 browser-use 这类项目代表“让 Agent 控制浏览器”,Alibaba 开源的 PageAgent 则选择了另一个方向:让 Agent 直接生活在网页内部。这个 TypeScript 项目的定位是 JavaScript in-page GUI agent,也就是通过页面内脚本,让用户用自然语言控制网页界面。截至本次整理时,PageAgent 在 GitHub 上已有 18582...
·6 分钟
阅读全文