Aletheia

Aletheia

Aletheia

Aletheia(希腊语意为"真理/揭示")是Google DeepMind于2026年3月9日发布的数学研究代理(Agent),标志着人工智能从"竞赛解题者"进化为"科研探索者"。它由Tony Feng、Trieu H. Trinh等学者领衔开发,核心动力源自Gemini Deep Think模型。

关键里程碑

  • 攻克4个开放性问题:在包含700个未解难题的Bloom’s Erdős Conjectures数据库中,Aletheia自主给出了四个长期悬而未决的数学问题的解。
  • 发表级论文:在没有任何人类干预的情况下完成了一篇达到出版水准的论文(Feng26)。
  • FirstProof基准测试:在职业数学家提议的测试集上表现远超同类模型。

技术核心

  • 迭代式思考:生成-验证-修正循环,具备高度自我反思能力。
  • 推理时间扩展定律:在推理阶段给予更多计算资源,解决复杂问题的能力呈指数级增长。
  • 端到端自然语言推理:选择自然语言而非形式化语言进行推理,提高可读性和人机协作效率。

伦理框架

Aletheia提出了[[人机交互卡片]](Human-AI Interaction Cards),用于量化AI在科研中的参与度、自主水平和新颖性贡献,确保学术透明。

相关页面

  • [[gemini-deep-think]]
  • [[推理时间扩展定律]]
  • [[自主数学研究]]
  • [[人机交互卡片]]
  • [[deepmind]]
分享到