多跳推理中的歧义解释

多跳推理中的歧义解释

多跳推理中的歧义解释是指训练模型在面对模糊指令时主动"反问"用户以消除歧义的能力，而非"瞎猜"。MARCH基准测试是该领域的代表性工作。

核心挑战

传统LLM在面对语义模糊的复杂指令时，往往会选择"瞎猜"或提供泛泛而谈的答案
需要训练模型学会在执行前先"反问"用户以消除歧义

关键发现

即便最先进的模型（如GPT-5.3）在未经专项训练时，处理复杂模糊任务的成功率也仅为42%

相关实体

[[march]] — 代表性基准测试
[[gpt-5.3]] — 测试对象