HumanMCP HumanMCP HumanMCP是一个在arXiv上线的动态更新数学评测基准数据集。 特点 直接从最新的数学论文中提取引理 将引理重写为自包含陈述 用于挑战大模型的最新逻辑极限 动态更新机制确保评测内容始终处于前沿