Eloundou et al. (2023)

提供任务级理论暴露度估计的先前研究，在Anthropic的"观察到的暴露度"指标构建中被用作理论能力的基准。该研究评估了LLM是否能使任务速度提高一倍（β指标），为Anthropic的新指标提供了理论框架的基础。

在报告中的用途

报告使用Eloundou et al. (2023)的任务级暴露度估计作为理论能力的衡量标准，结合O*NET数据库和Anthropic经济指数中的实际使用数据，构建了"观察到的暴露度"指标。