Anthropic重磅报告:AI抢饭碗,你的工作是理论风险还是现实危机?

Anthropic于2026年3月5日发布了题为《人工智能对劳动力市场的影响:一个新指标和早期证据》的研究报告。这份报告由Maxim Massenkoff和Peter McCrory撰写,引入了一个衡量AI取代风险的新指标——“观察到的暴露度”(Observed Exposure)。这一新指标结合了大型语言模型(LLM)的理论能力和现实世界中的实际使用数据。研究发现,尽管AI的理论能力很强,但实际应用覆盖率仍然只是其可行性的一小部分。

报告核心发现

  • 新的衡量指标: "观察到的暴露度"结合了理论LLM能力和实际使用数据,更侧重于自动化(而非增强性)和工作相关的用途。
  • 能力与部署的差距: AI的实际覆盖范围远未达到其理论能力。例如,在"计算机与数学"职业类别中,LLM在理论上可以渗透到94%的任务中,但目前Claude的实际覆盖率仅为33%。
  • 暴露度与工作增长预测: 观察到的暴露度较高的职业,根据美国劳工统计局(BLS)的预测,到2034年的增长预计会较慢。
  • 高暴露度群体的特征: 处于最暴露职业的工人更有可能年龄较大、是女性、受教育程度更高、收入更高。
  • 对失业率的有限影响: 报告发现,自2022年末以来,高暴露度工人的失业率没有系统性的增加。
  • 对年轻工人招聘的影响: 报告发现"暗示性证据",即在暴露度高的职业中,对年轻工人(22-25岁)的招聘速度有所放缓。

AI来了,工作去哪儿了?Anthropic新报告揭示AI对劳动力市场的"观察到的暴露度"

自ChatGPT发布以来,关于人工智能将如何颠覆职场的讨论从未停歇。我们都听说过AI能"理论上"取代多少工作,但实际情况真的如此吗?Anthropic公司在2026年3月5日发布的一份重磅研究报告,为我们提供了一个更贴近现实的视角:它引入了一个全新的衡量指标——“观察到的暴露度”,来评估AI对劳动力市场的实际影响,而非仅仅是理论上的可能性。

这份由Maxim Massenkoff和Peter McCrory撰写的报告,清醒地认识到在AI的**“理论能力""实际部署”**之间存在一道巨大的鸿沟。正如报告所指出的,过去衡量工作"外包可能性"的研究曾预测四分之一的美国工作面临风险,但十年后这些工作大多保持了健康的增长。因此,一个更精确、更及时的衡量工具至关重要。

一、如何精确衡量AI的"暴露度"?

报告的核心创新在于其"观察到的暴露度"(Observed Exposure)指标。传统的AI暴露度衡量大多停留在理论层面,比如某项任务能否被LLM加速一倍(如Eloundou et al. 2023的β指标)。Anthropic的新指标更进一步,它量化的是:“在那些LLM理论上可以加速的任务中,哪些在专业环境中被实际用于自动化用途?

这个新指标的构建是严谨且多维度的,主要结合了三个方面的数据:

  1. O*NET数据库:涵盖美国约800个独特职业的任务清单。
  2. 理论能力:来自Eloundou et al. (2023) 的任务级暴露度估计,即LLM是否能使任务速度提高一倍。
  3. 实际使用数据:Anthropic自己的Claude使用数据(Anthropic经济指数),特别关注自动化工作相关的用途和API实现。

简而言之,一个工作的"观察到的暴露度"越高,如果满足以下条件:任务理论上可被AI完成;任务在Anthropic经济指数中看到显著使用;任务是在工作相关背景下执行;自动化使用模式或API实施的份额较高;以及AI影响的任务占整个角色的更大比例。

报告清晰展示了理论与实际的关联性。在Claude的实际使用中,有97%的任务被Eloundou et al.评定为理论上可行(β=0.5或β=1),其中,被评为完全可行(β=1)的任务贡献了高达68%的观察到的Claude使用量。这表明,理论能力与实际应用高度相关,但实际应用更侧重于那些AI能够完全胜任的领域。

二、理论与现实的巨大差距

Anthropic的研究强调,“AI远未达到其理论能力:实际覆盖率仍然只是可行性的一小部分”

不同职业类别的"理论能力"和"观察到的暴露度"也存在差异。以计算机与数学职业为例,理论上LLM可以渗透到94%的任务中。然而,根据Claude的实际使用数据,目前仅覆盖了33%的任务办公室与行政职业理论覆盖率为90%,而实际覆盖率同样有巨大差距。

这种差距的存在有多种原因:模型限制、法律约束、特定的软件要求、人工验证步骤,以及任务缓慢的扩散速度。例如,理论上AI可以"授权药物续配并提供处方信息给药店",但Claude并未观察到执行此任务。

随着AI能力的提升、采纳的普及和部署的深化,我们预计"红色的观察到的暴露度区域会逐渐增长,最终覆盖蓝色的理论能力区域"。

三、哪些职业最"暴露"?

基于"观察到的暴露度"指标,报告列出了前十大最暴露的职业。毫不意外,与编码相关的工作位居榜首。

职业 观察到的暴露度 领先的自动化任务
计算机程序员 74.5% 编写、更新和维护软件程序
客户服务代表 70.1% 与客户协商提供信息、接受订单、处理投诉
数据录入员 67.1% 阅读源文件并向系统中输入数据
病历专家 66.7% 编制、摘要和编码患者数据
市场研究分析师和营销专家 64.8% 准备研究结果报告
批发和制造销售代表(技术和科学产品除外) 62.8% 联系客户演示产品和征求订单
金融和投资分析师 57.2% 通过分析财务信息预测商业、行业或经济状况,为投资决策提供信息
软件质量保证分析师和测试员 51.9% 修改软件以纠正错误或提高性能
信息安全分析师 48.6% 执行风险评估和测试数据处理安全性
计算机用户支持专家 46.8% 回答用户关于计算机软件或硬件操作的询问以解决问题

计算机程序员以74.5%的覆盖率位居榜首,其次是客户服务代表(70.1%)和数据录入员(67.1%)。在另一端,有30%的工人面临零暴露度,这包括厨师、摩托车修理工、救生员和调酒师等。

四、高暴露度职业的劳动力特征和未来预测

那么,这些暴露度高的工作前景如何?报告将"观察到的暴露度"与美国劳工统计局(BLS)对2024年至2034年的就业增长预测进行了比较。

结果发现,暴露度越高的职业,其预测的增长率往往越低。具体来说,AI覆盖率每增加10个百分点,BLS的增长预测就会下降0.6个百分点。这表明,Anthropic的新指标与独立的劳动力市场分析师的估计方向一致,尽管这种相关性"很小"。值得注意的是,单独使用Eloundou et al.的理论衡量指标则没有这种相关性。

更有趣的是,处于高暴露度群体的工人,与那些零暴露度的工人相比,有着显著不同的特征。数据显示(基于2022年8月至10月的CPS数据):

  • 收入更高:高暴露度群体的平均时薪比零暴露度群体高出47%($32.69 vs. $22.23)。
  • 教育程度更高:拥有研究生学位的人在高暴露度群体中占比17.4%,而在零暴露度群体中仅占4.5%。
  • 人口统计学特征:高暴露度群体有更高的比例是女性(54.4% vs. 38.8%)、白人非西班牙裔(65.1% vs. 54.5%),以及亚裔非西班牙裔(9.1% vs. 4.7%)。他们也更可能年龄稍大,平均年龄为42.9岁(零暴露度组为41.0岁)。

因此,AI的影响似乎首先触及的是"白领"和受过高等教育的工人,而不是收入较低、教育程度较低的工人,这与许多自动化趋势的传统模式有所不同。

五、早期影响:失业率平稳,招聘放缓

报告将失业率作为首要关注结果,因为它"最直接地捕捉了经济损害的潜力"。

利用Current Population Survey (CPS) 数据,研究人员分析了高暴露度工人(前四分位)和零暴露度工人(30%)的失业率趋势。

失业率方面
自ChatGPT发布以来,高暴露度组和零暴露度组的失业率趋势基本相似。在差异中的差异(DiD)框架下,高暴露度组失业率的平均变化"很小且不显著"。这意味着,到目前为止,AI尚未对高暴露度工人的失业率造成清晰、可辨识的冲击

招聘方面
虽然失业率未见显著上升,但报告发现了**“暗示性证据”,即AI正在影响招聘市场,特别是针对年轻工人**(22-25岁)。

报告引用了Brynjolfsson et al. (2025) 的发现,即在暴露度高的职业中,22至25岁工人的就业率下降了6%到16%,主要归因于招聘放缓。Anthropic的报告进一步通过追踪年轻工人开始新工作的月度比率(Inflow rate)来验证这一趋势。

自2024年以来,年轻工人进入高暴露度职业的招聘率(Job start rate)与进入零暴露度职业的招聘率开始出现视觉上的分化。高暴露度职业的招聘率下降了约0.5个百分点,而零暴露度职业的招聘率保持稳定。经计算,在ChatGPT发布后的时期,高暴露度职业的求职成功率下降了14%,尽管这一统计学意义"仅仅略微显著"。

这种招聘放缓可能意味着:面对AI的威胁,企业可能首先选择停止招聘新员工,而不是解雇现有员工。这对于刚进入劳动力市场的年轻人来说,影响最为直接。

六、结论与前瞻

Anthropic的这份报告为我们理解AI对劳动力市场的影响提供了一个宝贵且务实的框架。通过"观察到的暴露度"这一新指标,我们能够超越纯粹的理论预测,聚焦于LLM在专业环境中的实际、自动化用途。

关键发现再次强调:

  • 高暴露度职业:集中在计算机程序员、客户服务和金融分析师等白领和高技能岗位。
  • 短期影响:失业率尚未受到影响。
  • 早期信号:针对22-25岁年轻工人的招聘有所放缓。

报告的作者们坦诚,这仅仅是AI对劳动力市场影响的第一步。未来的研究可以进一步完善其使用数据和理论指标,并关注教育背景在高暴露度领域新毕业生的就业情况。

AI对经济结构的影响可能不会像COVID-19那样"巨大而突然",而更像互联网或与中国的贸易影响,其效果可能需要更长时间才能在宏观数据中清晰显现。这个新框架的作用正是在于:在影响尚不明确时,帮助我们识别出最脆弱的就业岗位

对于职场人士而言,这份报告提供了一个重要的启示:理论上的能力不等于即刻的风险。但"观察到的暴露度"正逐渐揭示AI正在何处、以何种速度吞噬工作任务。如果你是计算机程序员、客户服务代表或数据录入员,现在正是思考如何将LLM作为增强工具而非取代者,或提升自己不可替代性的"O形环"任务的时候了。

AI浪潮仍在继续,持续的、基于实际使用数据的追踪,将帮助我们更可靠地"将信号与噪音分离"。


原文下载: Anthropic AI对劳动力市场影响报告(PDF)

分享到