多跳推理中的歧义解释 article https://gyznsw.cn/knowledge/wiki/concepts/%E5%A4%9A%E8%B7%B3%E6%8E%A8%E7%90%86%E4%B8%AD%E7%9A%84%E6%AD%A7%E4%B9%89%E8%A7%A3%E9%87%8A.html 多跳推理中的歧义解释 多跳推理中的歧义解释是指训练模型在面对模糊指令时主动"反问"用户以消除歧义的能力,而非"瞎猜"。MARCH基准测试是该领域的代表性工作。 核心挑战 传统LLM在面对语义模糊的复杂指令时,往往会选择"瞎猜"或提供泛泛而谈的答案 需要训练模型学会在执行前先"反问"用户以消除歧义 关键发现 即便最先进的模型(如GPT-5.3)在未经专项训练时,处理复杂模糊任务的成功率也仅为42% 相关实体 [[march]] — 代表性基准测试 [[gpt-5.3]] — 测试对象