在 2026 年 2 月 13 日,Chrome 开发者团队在 X(前 Twitter)上发布了一条消息,宣布 WebMCP 进入早期预览阶段。这一消息迅速引发了科技社区的热议,帖子获得了数千个点赞和转发。WebMCP,全称为 Web Model Context Protocol,旨在为网站提供一种标准方式来暴露结构化工具,让 AI 代理能够以更高的速度、可靠性和精确性执行操作。
这不仅仅是一个技术更新,它标志着网络从人类中心向 AI 代理友好的方向转型。本文将围绕这一讨论,深入探讨 WebMCP 的背景、技术细节、益处、潜在挑战、实际应用以及未来影响,结合 X 上的社区反馈,力求全面呈现这一变革。
WebMCP 的起源与公告
WebMCP 的概念并非凭空出现。它源于 W3C 的 Web Machine Learning 社区小组,由 Google 和 Microsoft 的工程师共同孵化。
在 Chrome 146 Canary 版本中,这一协议首次以早期预览形式发布,开发者可以通过启用特定标志来测试。公告中强调,WebMCP 通过浏览器 API(如 navigator.modelContext)桥接网站和 AI 代理,让代理不再依赖于屏幕刮取或像素解析,而是直接调用结构化工具。
X 上的帖子内容简洁明了:“WebMCP 可用作早期预览 → https://developer.chrome.com/blog/webmcp-epp。WebMCP 旨在提供暴露结构化工具的标准方式,确保 AI 代理能够以更高的速度、可靠性和精确性在您的网站上执行操作。”
配图是一个彩色插图,展示了工具从网站流向代理的流程。
这条帖子迅速积累了近 3000 个点赞和数百次转发,回复区涌现出各种观点。从兴奋的“让我们开始吧!”到担忧的“一个新的攻击面”,讨论反映了科技界对这一创新的双重态度。
例如,用户 @h4x0r_dz 直言:“一个新的攻击面。” 这点出了安全隐患,而 @briancheong 则强调:“真正考验将是现实世界的认证流程和速率限制,而非简单演示。”
Chrome 团队回应道:“用这些高风险场景挑战预览有助于我们为每个人构建更好的网络。” 这些互动突显了 WebMCP 在平衡创新与安全方面的挑战。
WebMCP 的技术概述
WebMCP 核心在于两个互补的 API:声明式 API 和命令式 API。
声明式 API 允许开发者直接在 HTML 表单中定义标准操作,例如通过添加几个属性将表单转化为可调用的工具。想象一下,一个电商网站的“添加到购物车”按钮不再是 UI 元素,而是结构化函数,AI 代理可以直接调用 buyItem(productId, quantity) 而非模拟点击。
命令式 API 则更灵活,依赖 JavaScript 执行复杂动态交互。它类似于 OpenAI 或 Anthropic 的工具定义,但完全在浏览器客户端运行。这意味着工具在页面的 JavaScript 上下文中执行,并共享用户的活跃会话,无需单独的服务器或 API 密钥。
早期基准测试显示,与传统代理-浏览器交互相比,WebMCP 可减少 67% 的计算开销。
从协议层面看,WebMCP 是 MCP(Model Context Protocol)的浏览器扩展版。MCP 是一个通用适配器,将 AI 代理连接到工具和数据源,而 WebMCP 将其带入浏览器标签页。开发者可以通过 Chrome 的早期预览程序参与测试,程序提供文档、演示和 API 访问。参与步骤包括加入 Chrome Built-in AI Early Preview Program,并启用 chrome://flags 中的相关标志。
这一设计解决了当前 AI 代理的痛点。目前,代理如 Claude Code 或其他浏览器助手往往通过截屏和 DOM 解析“假装人类”,这不仅低效,还消耗大量令牌。WebMCP 让网站成为“工具服务器”,代理直接发现工具、调用函数并获取结构化响应。

图:WebMCP 架构示意图,展示了网站、浏览器和AI代理之间的交互关系
WebMCP 的益处:速度、可靠性和精确性
WebMCP 的核心益处在于提升 AI 代理的交互效率。
传统方法中,代理需要渲染页面、截屏、用视觉模型解析,然后决定点击动作,整个过程可能需要数秒并消耗数千令牌。WebMCP 简化这一切:代理直接查询可用工具列表,选择合适的函数调用,结果立即返回。
对开发者而言,这意味着网站可以主动参与“代理网络时代”。例如,一个旅行网站可以暴露 bookFlight(destination, date) 工具,让代理无缝预订行程,而非猜测按钮位置。这不仅提高了用户体验,还为网站带来了更多流量——代理优先选择支持 WebMCP 的站点。
从用户角度,WebMCP 开启了更智能的浏览器体验。想象 AI 助手在后台工作:它可以自动比较价格、填写表单,甚至处理复杂任务如客户支持查询,而无需用户手动干预。Cloudflare 的相关更新——实时将内容转换为 Markdown——进一步补充了这一生态,让代理更高效地“阅读”网页。
此外,WebMCP 促进了标准化。不同于当前的碎片化 API,它是一个开放标准,任何浏览器都可以实现。这类似于 USB-C 对充电器的统一,可能成为 AI 交互的“通用插头”。
潜在挑战与担忧
尽管前景光明,WebMCP 也引发了安全和隐私担忧。X 用户 @h4x0r_dz 的评论“一新的攻击面”道出了本质:暴露结构化工具可能引入新漏洞。
恶意代理可能滥用这些工具,导致数据泄露或 DDoS 攻击。认证和速率限制成为关键,如 @briancheong 所言,真实世界场景将考验协议的鲁棒性。
另一个挑战是采用率。网站需要更新代码以支持 WebMCP,这对小型开发者可能是负担。类似于早期结构化数据(Schema.org)的推广,WebMCP 需要生态支持才能普及。隐私方面,既然工具共享用户会话,代理可能访问敏感数据,这要求严格的权限控制。
伦理问题也不容忽视。代理自主执行动作可能放大偏见或错误决策。例如,如果代理误解意图而执行财务操作,后果严重。监管如欧盟的 PSD2(开放银行法规)可能成为模板,推动 WebMCP 的安全实施。
实际应用与示例
WebMCP 的应用潜力巨大。在电商领域,代理可以调用 addToCart 或 checkout 函数,实现无缝购物。旅行行业中,bookTicket 等工具让代理处理复杂预订。客户支持则通过 querySupport(ticketId) 加速响应。
一个具体示例:开发者在表单中添加三个 WebMCP 属性,代理即可将网站视为 API。
如一个 DoorDash-like 应用中,代理添加物品、应用优惠码并结账,全程无需 UI 交互。另一个是 BigQuery 查询工具,通过 MCP 采样 LLM 生成 SQL,然后执行。
在 X 上,用户 @skirano 分享了一个 starter 模板,演示代理如何在类似 DoorDash 的 app 中操作。这展示了 WebMCP 如何将浏览器转化为 API。

图:WebMCP 工作流程示意图,展示了从用户请求到AI代理执行的完整过程
未来影响:代理网络的兴起
WebMCP 是通往“代理网络”(Agentic Web)的关键一步。
网络将分裂成人类界面和 AI 接口,用户 @on3thr33s3v3n 预测道:“网络将分裂成人类界面和 AI 代理界面。” 这类似于 Web 3.0 的去中心化,但更注重代理自治。
与生成式 UI 结合,WebMCP 可创建动态界面,用户提示生成自定义视图。未来,代理可能自主学习、协调多站点任务,推动自动化革命。但这也引发就业影响:代理取代重复劳动,同时创造新角色如“代理优化师”。
从商业视角,AEO(Agent Engine Optimization)将成为新 SEO。网站优化工具暴露以吸引代理流量,类似于当前的搜索引擎优化。
社区反应与展望
X 上的讨论丰富多样。@EbenEsterhuizen 指出:“如果站点暴露 WebMCP 工具,代理不再与不可预测的 UI 斗争。从‘黑客 DOM’到‘调用 API’的可靠性提升巨大。”
@yaelmendez 称赞:“我们一些人一直知道这一刻会来。伟大的工作,Google 开发者!”
但也有质疑,如 @JussCubs:“MCP 已死,CLI 现在流行……而且在流行前就流行了。” 这些反馈显示社区对 WebMCP 的乐观与谨慎并存。Chrome 团队积极回应,承诺通过预览迭代改进。
总之,WebMCP 标志着网络从静态页面向动态工具库的转变。它不仅提升了 AI 代理效率,还重塑了开发者与用户的互动。
尽管面临挑战,这一协议有望开启代理主导的网络时代。未来,网络将更智能、更自主,我们只需拭目以待。