GDPVal 数据集

GDPVal 数据集

GDPVal 数据集

GDPVal 数据集是香港大学数据科学实验室(HKUDS)构建的 AI 生产力评估数据集,覆盖 44 个关键行业、220 个职业任务。

核心特性

  • 行业覆盖:涵盖制造业、金融业、技术与工程等 44 个关键领域。
  • 任务类型:要求 AI 执行真实世界任务,产出工程级交付物(如采购合同、财务审计报告、技术规格说明书等)。
  • 评估导向:用于量化 AI 在真实世界任务中的生产力,而非传统的标准化考试。

在 ClawWork 中的角色

GDPVal 数据集是 ClawWork 评估体系的核心组成部分。AI Agent 必须跨越 44 个行业执行任务,其产出由 Meta-Evaluator(GPT-5.2)根据行业 Rubrics 评估质量,并据此计算报酬。

相关实体

  • [[openclaw]] — 使用 GDPVal 数据集进行 AI 生产力评估的智能体框架
  • [[香港大学数据科学实验室]] — GDPVal 数据集的构建方
  • [[动态报酬函数]] — 基于 GDPVal 数据集的任务评估结果计算报酬
分享到