Qwen团队

Qwen团队

Qwen团队

阿里巴巴旗下的大语言模型研究团队。2026年3月,Qwen团队提交了DIVE研究,提出了一种"逆向合成"训练方案,通过先执行现实世界的工具调用痕迹再反推任务逻辑,实现了"由建设驱动的接地性"。在9项OOD基准测试中,基于该方案训练的8B模型甚至超越了部分70B模型。

关键研究

  • DIVE (证据驱动合成) — 通过执行真实工具调用痕迹反推任务逻辑的训练方案
  • Grounding by Construction — 使模型学习更"接地气"的方法论

相关概念

  • [[sub-1-bit-llm]] — 模型压缩与推理效率研究
  • [[推理侧算力扩展定律]] — 解释小模型+多步推理能超越大模型
分享到