动态报酬函数

动态报酬函数

动态报酬函数

动态报酬函数是 ClawWork (OpenClaw) 框架中用于计算 AI 任务报酬的核心公式,它将 AI 产出与现实世界生产力价值挂钩。

公式定义

$$P = Q \times \hat{H} \times W_{BLS}$$

其中:

  • $P$:任务报酬(美元)。
  • $Q \in [0, 1]$:质量权重,由 Meta-Evaluator(GPT-5.2 级别模型)根据 44 个不同行业的专业 Rubrics 生成。
  • $\hat{H}$:标准工时,该任务在人类社会中的预期完成时间。
  • $W_{BLS}$:时薪基准,对应职业在美国劳工统计局(BLS)数据中的现实世界时薪。

核心特性

  • 价值锚定:AI 赚到的每一分钱都对应着现实世界的生产力产出。
  • 质量驱动:质量权重 Q 由专业评估模型根据行业标准生成,确保评估的客观性。
  • 行业适配:不同行业有不同的 Rubrics,确保评估的针对性和公平性。

在 ClawWork 中的角色

动态报酬函数是 ClawWork "自负盈亏生存系统"的收入端核心机制。它与实时成本扣除共同构成了 AI 的经济生存环境,使 AI 的每一次调用都变成了一次决策风险。

相关概念

  • [[自负盈亏生存系统]] — 动态报酬函数所属的经济模型
  • [[AGI经济学]] — 动态报酬函数的理论基础
  • [[美国劳工统计局]] — 时薪基准 W_{BLS} 的数据来源
  • [[gpt-5-2]] — 作为 Meta-Evaluator 生成质量权重 Q 的模型
  • [[gdpval-数据集]] — 提供行业 Rubrics 和任务标准的评估数据集
分享到