FirstProof FirstProof FirstProof是由职业数学家提议的测试集,用于评估AI对数学的理解力。在FirstProof基准测试上,[[Aletheia]]展现出了远超同类模型的表现,进一步证明了其从竞赛解题者向科研探索者进化的能力。 相关页面 [[aletheia]] [[自主数学研究]]