Gemma 4

Gemma 4

谷歌DeepMind于2026年4月发布的最强开源模型家族，基于与Gemini 3相同的底层技术架构构建，通过Apache 2.0协议向全球开发者开放。

版本规格

Effective 2B (E2B)：专为移动端和IoT终端设计的极小参数模型，极低内存占用和功耗。
Effective 4B (E4B)：与E2B类似，面向端侧AI推理，兼顾电池寿命与智能水平。
26B Mixture of Experts (MoE)：采用混合专家架构，推理时只激活部分专家参数，兼顾效率与复杂问题处理能力。
31B Dense（稠密模型）：旗舰版本，在Arena.ai开源模型排行榜上空降全球第三名。

性能表现

31B Dense在多项基准测试中击败体量比其大20倍的其他开源模型
26B MoE版本位列Arena.ai开源榜第六名
全面支持高级推理、Agentic Workflows（智能体工作流）及复杂代码生成

行业影响

Gemma 4的发布标志着两个重要趋势：参数效率正在取代单纯的参数规模成为新的竞争焦点；算力下沉是巨头布局的关键，通过优化极小参数模型在边缘设备上建立生态护城河。