Gemma 4
谷歌DeepMind于2026年4月发布的最强开源模型家族,基于与Gemini 3相同的底层技术架构构建,通过Apache 2.0协议向全球开发者开放。
版本规格
- Effective 2B (E2B):专为移动端和IoT终端设计的极小参数模型,极低内存占用和功耗。
- Effective 4B (E4B):与E2B类似,面向端侧AI推理,兼顾电池寿命与智能水平。
- 26B Mixture of Experts (MoE):采用混合专家架构,推理时只激活部分专家参数,兼顾效率与复杂问题处理能力。
- 31B Dense(稠密模型):旗舰版本,在Arena.ai开源模型排行榜上空降全球第三名。
性能表现
- 31B Dense在多项基准测试中击败体量比其大20倍的其他开源模型
- 26B MoE版本位列Arena.ai开源榜第六名
- 全面支持高级推理、Agentic Workflows(智能体工作流)及复杂代码生成
行业影响
Gemma 4的发布标志着两个重要趋势:参数效率正在取代单纯的参数规模成为新的竞争焦点;算力下沉是巨头布局的关键,通过优化极小参数模型在边缘设备上建立生态护城河。