Stanford AI Index
Stanford AI Index是斯坦福大学发布的年度AI发展状况报告,提供关于AI技术进展、产业生态和政策环境的全面数据。
2026年报告关键发现
- FrontierMath基准突破: 前沿模型在FrontierMath上的准确率从2024年底的不足2%飙升至超过50%,一年多时间内AI在高难度数学推理方面的能力提升了约25倍
- 模型生态丰富: 全球AI生态系统中已有超过500个模型通过商业API和开源渠道提供服务,从OpenAI的GPT系列到Anthropic的Claude、Google的Gemini和Meta的Llama家族
- 开发者选择空前丰富: 开发者面临前所未有的丰富模型选择
与维基概念的关联
FrontierMath准确率的快速提升与[[大模型不是真理机器-而是论证机器]]中"大模型追求可信度而非真实性"的观点形成张力——数学能力的提升是否意味着模型更接近"真理",还是仅仅是其"论证"能力的增强?