推理时计算扩展 (Inference-time Scaling)

推理时计算扩展 (Inference-time Scaling)

模型在处理复杂问题时，通过内部“思维沙盘”生成大量潜变量进行自我推演与证伪的技术，而非简单预测下一个词。标志着AI从“直觉反应”向“深度审视”的质变。

技术特点

思维沙盘：模型内部生成数万个潜变量进行自我推演
自我证伪：模型能够主动检查自身推理的正确性
深度审视：超越简单的模式匹配，进行深层次逻辑分析

性能提升

Gemini 3.1 Pro通过该技术在ARC-AGI-2上取得77.1%的得分，较半年前提升近2.5倍。

相关概念

[[gemini-3-1-pro]] — 应用该技术的模型
[[arc-agi-2]] — 验证该技术的基准测试
[[大模型不是真理机器-而是论证机器]] — 从哲学角度探讨模型推理能力