最大似然估计（MLE）

定义

最大似然估计（Maximum Likelihood Estimation, MLE）是大语言模型的核心训练目标。模型在万亿级token上学习：在什么样的上下文里，什么样的续写最可能出现。这使得模型追求"可信度"而非"真实性"。

MLE解释了[[大模型作为论证机器|大模型为何是论证机器而非真理机器]]。模型的优化目标是让下一句话"听起来最合理、最自然"，而非"与客观事实对应"。这使模型成为史上最强大的"修辞引擎"——它没有"真假"概念，只有"统计说服力"。