PapersWithCode 复活了，但这次靠的是 AI 代理：Hugging Face 正在补上一个研究社区的大坑

2026-05-19

AI智能体, 机器学习, 开源社区, Hugging-Face, PapersWithCode

摘要：Hugging Face 开源团队在 Niels Rogge 的推动下，开始复兴一个很多研究者一直惦记的老资源：PapersWithCode。关键变化不只是网站回来了，而是它第一次把 AI 代理拉进了“论文解析与排行榜生成”这件事里。

机器学习社区这两年有一个不大不小、但很多人都真切感到难受的空缺：PapersWithCode 没了灵魂。

准确地说，不是域名消失了，也不是“论文趋势页”完全不存在了，而是那个曾经把论文、代码、任务、数据集、评测榜单和 SOTA 结果连成一张知识网的资源，逐渐失去了维护节奏。对做研究的人来说，这不是怀旧问题，而是效率问题。你想知道某个任务的最新最优结果、某篇论文有没有开源实现、一个新模型到底是在刷哪张榜、一个 benchmark 最近被谁重新定义，过去很多人第一反应就是去 PapersWithCode。

现在，Hugging Face 的开源团队开始试图把这块拼图重新拼起来。

根据 Niels Rogge 在 Reddit 上的介绍，这个复兴版项目由 Hugging Face 开源团队推动，目标是重建一个类似 PapersWithCode 的资源中心。最关键的一点，是他们没有完全走传统手工维护路线，而是明确引入了 AI 代理来解析高影响力论文、抽取任务与结果、并自动生成排行榜。Niels 同时也特别说明了一点：目前这些由代理生成的结果，仍由人工进行核验。这个细节很重要，因为它意味着这不是一个“把论文丢给模型、输出就直接上线”的全自动流水线，而更像一个 AI 辅助的人机协作策展系统。

这正是这次复兴最值得注意的地方。PapersWithCode 当年最宝贵的，不只是“有很多论文链接”，而是它把研究成果重新组织成了可导航、可比较、可复用的结构化知识。问题在于，这件事一直非常吃人工。要维护任务层级、benchmark 名称、评测口径、实现链接和排行榜一致性，工作量巨大，而且越到大模型时代越难跟上。现在 Hugging Face 试图用 AI 代理把“高密度论文策展”规模化，再用人工把关键结果卡住，这其实是在回答一个现实问题：如果没有自动化，今天已经没有人能长期、稳定、低成本地维护这样一个站。

从现有公开介绍看，这个复兴版覆盖的不是泛泛而谈的论文目录，而是明显朝着“对研究者有用”的方向去搭结构。Niels 在介绍里提到，系统目前优先解析那些他明确知道已经做到 SOTA 的高影响力论文，例如 Qwen 3.5 / 3.6、RF-DETR、DINOv3，以及来自 MTEB / MMTEB、Open ASR 等榜单生态的代表性模型。你从这个选择就能看出它的产品思路：先不贪大求全，而是先把最容易被研究者反复查询、且最适合结构化呈现的部分做扎实。

这件事为什么重要？因为今天研究圈最缺的，不是论文，而是“论文之间的关系”。arXiv 每天都有新东西，Hugging Face 自己也早就把 trending papers 做得很顺手，但趋势流不是知识图谱。你看到一篇热门论文，不代表你立刻知道它属于哪个任务、胜过了谁、用了什么数据集、有没有代码、是不是只在特定子榜单上短暂领先、有没有更稳妥的复现版本。PapersWithCode 当年提供的，恰恰是这种“把孤立论文重新放回上下文”的能力。

而这正是 Meta 收购之后，社区最惋惜的地方。过去一段时间里，不少研究者都在抱怨：原来的站点还在，但它越来越像一个历史遗址，能看，却不再持续长出新东西。有人甚至直接把这件事看作研究社区公共基础设施失修的象征。代码仓库、论文平台、趋势聚合页都很多，但真正把“论文-代码-基准-结果”四件事绑在一起的公共入口并不多。一旦这个入口失速，研究者要么靠自己手搓收藏夹，要么在零散链接之间来回跳。

Hugging Face 这次出手，某种程度上就是在补这个坑。更准确地说，是在补一个被证明确实存在、而且已经影响日常工作流的坑。

当然，复兴版现在还谈不上完全取代昔日的 PapersWithCode。至少从公开信息看，它目前更像一个正在快速搭骨架的系统，而不是已经打磨到极成熟阶段的终态产品。比如 paperswithcode.co 本身还处在较新的启动状态，外界能看到的很多信息仍主要来自 Niels 的介绍和相关入口页，而不是一整套已经稳定对外文档化的产品说明。这意味着它现在最重要的不是“是不是已经完美”，而是“是否重新证明这条路线值得继续维护”。

我倾向于认为，答案是值得。

原因很简单。AI 时代的论文数量只会继续爆炸，评测榜单只会越来越碎，模型家族只会越来越复杂，外部论文与非 arXiv 来源也会越来越多。如果还想保留一个让研究者快速定位“最先进实现”和“当前任务地图”的公共资源，那么单靠纯人工维护已经越来越不现实。Hugging Face 这次给出的方案，本质上不是把 AI 塞进一个老网站，而是重新定义这类网站该如何活下去：代理负责扩张速度，人类负责守住可信度。

这套思路能不能成功，最后取决于两个东西。第一，代理解析后的结构化信息是否足够稳定，尤其是在任务定义、指标口径和模型归类这些最容易出错的地方。第二，人工校验能否跟上增长速度，而不是随着覆盖面扩大重新滑回“看起来很全，但细节经不起推敲”的老问题。

但即便如此，这次复兴依然已经足够有价值。因为它至少做对了一件事：它没有把研究社区真正需要的基础设施，降格成一个只追热点的“论文资讯页”。它想恢复的是连接能力，是可比较性，是让论文重新变得可用，而不是只变得可看。

如果你是研究者、工程师，或者只是经常要追模型进展的人，你大概都知道这意味着什么。少一个这样的站点，日常工作会变得更碎；多一个这样的站点，整个社区的检索成本、复现成本和认知负担都会下降。

PapersWithCode 之所以当年被喜欢，不是因为名字响，而是因为它提供了一种非常稀缺的秩序。今天 Hugging Face 想把这套秩序重新建起来，而且第一次明确把 AI 代理放进维护链路里。这件事如果做成，意义可能不只是“复活一个老牌网站”，而是给整个 AI 研究社区示范了一种新的公共知识基础设施该怎么建。

参考来源：

Reddit：r/MachineLearning，Niels Rogge 关于复兴 PapersWithCode 的介绍帖。
Hugging Face / Papers 相关公开入口与搜索结果描述。
社区关于 Meta 收购后 PapersWithCode 停止维护、原站重定向的公开讨论记录。

AI技术