摘要:Google I/O 之后,AI 竞争的焦点进一步从“模型发布”转向“谁能把 agent 能力塞进高频入口、开发者平台和真实工作流”。Google 用 agentic Gemini era 把分发、模型和产品一起拉通,Anthropic 用 Claude Design 把 AI 从代码推进到视觉创作,OpenAI 则继续补可信内容识别与企业级部署底盘。
今天 AI 技术线最值得记住的变化,不再只是“Google 昨天发了 Gemini 3.5”,而是 Google 已经把这轮竞争明确推向了 agent 分发战。Sundar Pichai 在 I/O 2026 的完整口径里给出了非常强的信号:Google 正试图同时拿下模型、产品入口、开发者平台和云基础设施,把 Gemini 从一个聊天产品升级为贯穿搜索、应用和工作流的系统能力。与此同时,Anthropic 用 Claude Design 把 AI 从代码生成进一步推进到视觉设计和轻量创作,OpenAI 则继续在内容溯源和企业部署两条关键底盘上加码。头部公司今天比的,已经不是谁会聊天,而是谁更像一个完整的 AI 操作层。
Google Blog 在 5 月 19 日发布的《I/O 2026: Welcome to the agentic Gemini era》比单纯的产品新闻更重要,因为它等于给未来一年 Google 的 AI 方向定了总标题。文章里最值得注意的不是一句营销口号,而是一组相互支撑的数据:Google 全栈表面每月处理 token 已超过 3.2 quadrillion,月度使用其模型构建应用的开发者超过 850 万,模型 API 每分钟处理大约 190 亿 token,Search 的 AI Mode 已超过 10 亿月活,Gemini app 也已从去年的 4 亿月活增至 9 亿以上。
这些数字说明,Google 不再只是把 Gemini 当作一个独立模型品牌去运营,而是在把它变成一个跨搜索、地图、YouTube、Android、Cloud 和开发者生态的共同底层。只要这条链打通,Google 的优势就不是某个 benchmark 高一点,而是它拥有把 agent 能力迅速分发到几十亿级用户和企业开发者手里的管道。今天 AI 技术圈真正要重视的,是这种“入口+模型+平台”的系统打法开始成形。
如果把昨天的焦点只理解成“Gemini 3.5 Flash 发布”,仍然会低估这轮更新。Google 在 I/O 相关页面里反复强调 coding、long-horizon tasks、multi-step workflows 和 action,这其实是在重新定义模型价值。过去一轮竞争看重的是谁更会回答问题、谁的多模态更顺滑,今天 Google 更强调的是:模型能不能被放进真正的工作流里,能不能更稳定地完成多步任务,能不能成为 agent 系统中的执行核心。
这对行业的影响很直接。谁更擅长长链路任务,谁就更可能先吃到企业预算、开发者插件生态和业务流程改造的红利。Google 现在的做法,是一边在模型侧讲 frontier intelligence with action,一边在产品层面把 AI Mode、Gemini app 和各种 agent 入口做厚。也就是说,它不是只在发布一个更强模型,而是在搭建一整套以 agent 为中心的分发架构。
Anthropic 新闻页今天最值得关注的条目不是新模型参数,而是《Introducing Claude Design by Anthropic Labs》。官方描述很明确:Claude Design 允许用户与 Claude 协作完成 designs、prototypes、slides、one-pagers 等 polished visual work。这是一个很强的信号,说明 Anthropic 不满足于把 Claude 固定在聊天和编程助手的位置,而是进一步向设计、原型和营销物料这些高频创作场景推进。
这件事的意义在于,AI 产品的竞争边界正在继续外扩。过去几个月,行业已经看到“代码生成”从辅助工具走向核心工作流,现在视觉设计、演示文稿和轻量产品原型也开始被重新定义。谁先把自然语言、模型推理和可交付的视觉结果打包成一个稳定产品,谁就可能抢走原来属于传统设计软件和办公链路的一部分时间份额。Claude Design 今天虽然还是 Labs 产品,但它代表的是一种很现实的产品进攻方向。
OpenAI 在 5 月 19 日发布的《Advancing content provenance for a safer, more transparent AI ecosystem》显示,这家公司正在把“模型生成后的可信识别”提升到更高优先级。新动作包括:让 OpenAI 成为 C2PA conforming generator product、把 Google DeepMind 的 SynthID 引入到 ChatGPT、Codex 和 OpenAI API 生成图片的水印方案里,以及预览一个公开验证工具,用来帮助外部用户判断上传图片是否带有 OpenAI 的 provenance signals。
如果再结合 OpenAI News 列表里同时出现的 Dell Technologies 与 Codex 混合及本地部署合作,可以看出 OpenAI 正在补两块过去最容易被忽视但对企业至关重要的底盘:一块是内容可信识别与透明度,一块是混合云和本地环境的可交付能力。模型能力再强,如果无法通过企业治理、品牌安全和合规审计,真正的大客户仍然不敢深度接入。今天 OpenAI 更像是在把“能不能放心用”也做成产品力。
NVIDIA 今天发布的《NVIDIA and Google Cloud Empower the Next Wave of AI Builders》虽然不是一篇单独的模型新闻,但它很好地补上了另外一条关键链路:开发者和算力基础设施。文章里提到的重点包括与 Google Cloud 一起推进 JAX、Gemma、Nemotron、Dynamo、GKE 以及面向 agent workloads 的训练和推理路径,同时还点到 SynthID 与 Cosmos 的组合,为 physical AI、机器人和自治机器场景提供更强的内容透明与仿真能力。
这意味着,今天头部 AI 公司的竞争已经很难只按“模型公司”来理解。Google 在做模型和入口,Anthropic 在做新型创作界面,OpenAI 在补信任和企业交付,NVIDIA 在补计算与开发工具链。真正拉开差距的,将是谁能把模型、开发框架、云平台、分发入口和行业工作流同时压成一套可运行的系统。
今天的判断很清楚:AI 行业正在从“前沿模型轮番发布”进入“谁能成为 AI 操作层”的竞争阶段。Google 率先把这层意思说穿了,Anthropic 和 OpenAI 分别在创作界面与可信部署侧推进,NVIDIA 则继续把底层基础设施做厚。接下来最有价值的公司,不一定只是模型效果最好的公司,而是最能把 agent 能力嵌进高频入口、开发者生态与真实业务流程的公司。
1. Google Blog: I/O 2026: Welcome to the agentic Gemini era。
2. Google DeepMind: Models 页面与 Gemini 系列相关说明。
3. Anthropic News: Introducing Claude Design by Anthropic Labs。
4. OpenAI: Advancing content provenance for a safer, more transparent AI ecosystem。
5. OpenAI News: OpenAI and Dell Technologies partner to bring Codex to hybrid and on-premises enterprise environments。
6. NVIDIA Blog: NVIDIA and Google Cloud Empower the Next Wave of AI Builders。
7. CNBC: Google debuts new AI models, personal AI agents in effort to keep pace with OpenAI and Anthropic。
关注高促会新质生产力工委会公众号
关注工业智能算网平台
发布日期:2026年5月21日
发布机构:中国高技术产业发展促进会新质生产力工作委员会
本报告仅供行业研究参考,不构成投资建议