Google Gemini 3.1 Flash-Lite
[[Google DeepMind]]和[[Google AI]]推出的专门针对超大规模、极低延迟场景的轻量化模型,是[[推理成本厘时代]]到来的标志性模型。
关键参数
- 价格:每百万输入Token仅需$0.25
- 性能:在GPQA Diamond科学推理基准上达到86.9%的高分,甚至超越了去年的主流旗舰模型
- 定位:专为超大规模、极低延迟场景设计
行业意义
Gemini 3.1 Flash-Lite的发布标志着AI推理成本竞争已进入"厘"时代,使得万亿级Token的应用场景成为可能,将推动AI应用的规模化普及。