HumanMCP

HumanMCP

HumanMCP

HumanMCP是一个在arXiv上线的动态更新数学评测基准数据集。

特点

  • 直接从最新的数学论文中提取引理
  • 将引理重写为自包含陈述
  • 用于挑战大模型的最新逻辑极限
  • 动态更新机制确保评测内容始终处于前沿
分享到