Page Agent 是阿里巴巴开源的一款纯 JavaScript 实现的 GUI Agent。它允许用户通过自然语言直接操作 Web 应用,无需安装浏览器插件、Python 环境或无头浏览器。它专为客户端网页增强设计,是为产品添加 AI 副驾驶(Copilot)的极简方案。

✨ 特色
🎯 轻松集成
无需 浏览器插件 / Python / 无头浏览器,纯页面内 JavaScript
📖 基于文本的 DOM 操作
无需截图,无需多模态模型或特殊权限
🧠 自备 LLM
🐙 可选的 Chrome 扩展,支持跨页面任务
MCP Server (Beta)

💡 应用场景
SaaS AI Copilot — 几行代码为你的产品加上 AI 副驾驶,无需重写后端。
智能表单填写 — 把 20 次点击变成一句话。ERP、CRM、管理后台的最佳拍档。
无障碍增强 — 用自然语言让任何网页无障碍。语音指令、屏幕阅读器,零门槛。
跨页面 Agent — 通过可选的 Chrome 扩展,让你自己的 Web Agent 跨标签页工作。
通过 MCP 为现有 Agent 加入浏览器控制能力。

GitHub地址:https://github.com/alibaba/page-agent

声明:本站内容均收集于互联网,如不慎侵犯到您的版权利益,请附带相关证明文件来信本站将立即予以下架删除。