推理时计算扩展 (Inference-time Scaling)
模型在处理复杂问题时,通过内部“思维沙盘”生成大量潜变量进行自我推演与证伪的技术,而非简单预测下一个词。标志着AI从“直觉反应”向“深度审视”的质变。
技术特点
- 思维沙盘:模型内部生成数万个潜变量进行自我推演
- 自我证伪:模型能够主动检查自身推理的正确性
- 深度审视:超越简单的模式匹配,进行深层次逻辑分析
性能提升
Gemini 3.1 Pro通过该技术在ARC-AGI-2上取得77.1%的得分,较半年前提升近2.5倍。
相关概念
- [[gemini-3-1-pro]] — 应用该技术的模型
- [[arc-agi-2]] — 验证该技术的基准测试
- [[大模型不是真理机器-而是论证机器]] — 从哲学角度探讨模型推理能力