Aletheia
Aletheia(希腊语意为"真理/揭示")是Google DeepMind于2026年3月9日发布的数学研究代理(Agent),标志着人工智能从"竞赛解题者"进化为"科研探索者"。它由Tony Feng、Trieu H. Trinh等学者领衔开发,核心动力源自Gemini Deep Think模型。
关键里程碑
- 攻克4个开放性问题:在包含700个未解难题的Bloom’s Erdős Conjectures数据库中,Aletheia自主给出了四个长期悬而未决的数学问题的解。
- 发表级论文:在没有任何人类干预的情况下完成了一篇达到出版水准的论文(Feng26)。
- FirstProof基准测试:在职业数学家提议的测试集上表现远超同类模型。
技术核心
- 迭代式思考:生成-验证-修正循环,具备高度自我反思能力。
- 推理时间扩展定律:在推理阶段给予更多计算资源,解决复杂问题的能力呈指数级增长。
- 端到端自然语言推理:选择自然语言而非形式化语言进行推理,提高可读性和人机协作效率。
伦理框架
Aletheia提出了[[人机交互卡片]](Human-AI Interaction Cards),用于量化AI在科研中的参与度、自主水平和新颖性贡献,确保学术透明。
相关页面
- [[gemini-deep-think]]
- [[推理时间扩展定律]]
- [[自主数学研究]]
- [[人机交互卡片]]
- [[deepmind]]