摘要:Hugging Face 开源团队在 Niels Rogge 的推动下,开始复兴一个很多研究者一直惦记的老资源:PapersWithCode。关键变化不只是网站回来了,而是它第一次把 AI 代理拉进了“论文解析与排行榜生成”这件事里。
机器学习社区这两年有一个不大不小、但很多人都真切感到难受的空缺:PapersWithCode 没了灵魂。
准确地说,不是域名消失了,也不是“论文趋势页”完全不存在了,而是那个曾经把论文、代码、任务、数据集、评测榜单和 SOTA 结果连成一张知识网的资源,逐渐失去了维护节奏。对做研究的人来说,这不是怀旧问题,而是效率问题。你想知道某个任务的最新最优结果、某篇论文有没有开源实现、一个新模型到底是在刷哪张榜、一个 benchmark 最近被谁重新定义,过去很多人第一反应就是去 PapersWithCode。
现在,Hugging Face 的开源团队开始试图把这块拼图重新拼起来。
根据 Niels Rogge 在 Reddit 上的介绍,这个复兴版项目由 Hugging Face 开源团队推动,目标是重建一个类似 PapersWithCode 的资源中心。最关键的一点,是他们没有完全走传统手工维护路线,而是明确引入了 AI 代理来解析高影响力论文、抽取任务与结果、并自动生成排行榜。Niels 同时也特别说明了一点:目前这些由代理生成的结果,仍由人工进行核验。这个细节很重要,因为它意味着这不是一个“把论文丢给模型、输出就直接上线”的全自动流水线,而更像一个 AI 辅助的人机协作策展系统。
这正是这次复兴最值得注意的地方。PapersWithCode 当年最宝贵的,不只是“有很多论文链接”,而是它把研究成果重新组织成了可导航、可比较、可复用的结构化知识。问题在于,这件事一直非常吃人工。要维护任务层级、benchmark 名称、评测口径、实现链接和排行榜一致性,工作量巨大,而且越到大模型时代越难跟上。现在 Hugging Face 试图用 AI 代理把“高密度论文策展”规模化,再用人工把关键结果卡住,这其实是在回答一个现实问题:如果没有自动化,今天已经没有人能长期、稳定、低成本地维护这样一个站。
从现有公开介绍看,这个复兴版覆盖的不是泛泛而谈的论文目录,而是明显朝着“对研究者有用”的方向去搭结构。Niels 在介绍里提到,系统目前优先解析那些他明确知道已经做到 SOTA 的高影响力论文,例如 Qwen 3.5 / 3.6、RF-DETR、DINOv3,以及来自 MTEB / MMTEB、Open ASR 等榜单生态的代表性模型。你从这个选择就能看出它的产品思路:先不贪大求全,而是先把最容易被研究者反复查询、且最适合结构化呈现的部分做扎实。
这件事为什么重要?因为今天研究圈最缺的,不是论文,而是“论文之间的关系”。arXiv 每天都有新东西,Hugging Face 自己也早就把 trending papers 做得很顺手,但趋势流不是知识图谱。你看到一篇热门论文,不代表你立刻知道它属于哪个任务、胜过了谁、用了什么数据集、有没有代码、是不是只在特定子榜单上短暂领先、有没有更稳妥的复现版本。PapersWithCode 当年提供的,恰恰是这种“把孤立论文重新放回上下文”的能力。
而这正是 Meta 收购之后,社区最惋惜的地方。过去一段时间里,不少研究者都在抱怨:原来的站点还在,但它越来越像一个历史遗址,能看,却不再持续长出新东西。有人甚至直接把这件事看作研究社区公共基础设施失修的象征。代码仓库、论文平台、趋势聚合页都很多,但真正把“论文-代码-基准-结果”四件事绑在一起的公共入口并不多。一旦这个入口失速,研究者要么靠自己手搓收藏夹,要么在零散链接之间来回跳。
Hugging Face 这次出手,某种程度上就是在补这个坑。更准确地说,是在补一个被证明确实存在、而且已经影响日常工作流的坑。
当然,复兴版现在还谈不上完全取代昔日的 PapersWithCode。至少从公开信息看,它目前更像一个正在快速搭骨架的系统,而不是已经打磨到极成熟阶段的终态产品。比如 paperswithcode.co 本身还处在较新的启动状态,外界能看到的很多信息仍主要来自 Niels 的介绍和相关入口页,而不是一整套已经稳定对外文档化的产品说明。这意味着它现在最重要的不是“是不是已经完美”,而是“是否重新证明这条路线值得继续维护”。
我倾向于认为,答案是值得。
原因很简单。AI 时代的论文数量只会继续爆炸,评测榜单只会越来越碎,模型家族只会越来越复杂,外部论文与非 arXiv 来源也会越来越多。如果还想保留一个让研究者快速定位“最先进实现”和“当前任务地图”的公共资源,那么单靠纯人工维护已经越来越不现实。Hugging Face 这次给出的方案,本质上不是把 AI 塞进一个老网站,而是重新定义这类网站该如何活下去:代理负责扩张速度,人类负责守住可信度。
这套思路能不能成功,最后取决于两个东西。第一,代理解析后的结构化信息是否足够稳定,尤其是在任务定义、指标口径和模型归类这些最容易出错的地方。第二,人工校验能否跟上增长速度,而不是随着覆盖面扩大重新滑回“看起来很全,但细节经不起推敲”的老问题。
但即便如此,这次复兴依然已经足够有价值。因为它至少做对了一件事:它没有把研究社区真正需要的基础设施,降格成一个只追热点的“论文资讯页”。它想恢复的是连接能力,是可比较性,是让论文重新变得可用,而不是只变得可看。
如果你是研究者、工程师,或者只是经常要追模型进展的人,你大概都知道这意味着什么。少一个这样的站点,日常工作会变得更碎;多一个这样的站点,整个社区的检索成本、复现成本和认知负担都会下降。
PapersWithCode 之所以当年被喜欢,不是因为名字响,而是因为它提供了一种非常稀缺的秩序。今天 Hugging Face 想把这套秩序重新建起来,而且第一次明确把 AI 代理放进维护链路里。这件事如果做成,意义可能不只是“复活一个老牌网站”,而是给整个 AI 研究社区示范了一种新的公共知识基础设施该怎么建。
参考来源:
- Reddit:r/MachineLearning,Niels Rogge 关于复兴 PapersWithCode 的介绍帖。
- Hugging Face / Papers 相关公开入口与搜索结果描述。
- 社区关于 Meta 收购后 PapersWithCode 停止维护、原站重定向的公开讨论记录。