Google Gemini 3.1 Flash-Lite

Google Gemini 3.1 Flash-Lite

[[Google DeepMind]]和[[Google AI]]推出的专门针对超大规模、极低延迟场景的轻量化模型，是[[推理成本厘时代]]到来的标志性模型。

关键参数

价格：每百万输入Token仅需$0.25
性能：在GPQA Diamond科学推理基准上达到86.9%的高分，甚至超越了去年的主流旗舰模型
定位：专为超大规模、极低延迟场景设计

行业意义

Gemini 3.1 Flash-Lite的发布标志着AI推理成本竞争已进入"厘"时代，使得万亿级Token的应用场景成为可能，将推动AI应用的规模化普及。