Google Gemini 3.1 Flash-Lite

Google Gemini 3.1 Flash-Lite

Google Gemini 3.1 Flash-Lite

[[Google DeepMind]]和[[Google AI]]推出的专门针对超大规模、极低延迟场景的轻量化模型,是[[推理成本厘时代]]到来的标志性模型。

关键参数

  • 价格:每百万输入Token仅需$0.25
  • 性能:在GPQA Diamond科学推理基准上达到86.9%的高分,甚至超越了去年的主流旗舰模型
  • 定位:专为超大规模、极低延迟场景设计

行业意义

Gemini 3.1 Flash-Lite的发布标志着AI推理成本竞争已进入"厘"时代,使得万亿级Token的应用场景成为可能,将推动AI应用的规模化普及。

分享到