Project Deal:Anthropic 让 Claude 代替人类讨价还价的实验

Project Deal:Anthropic 让 Claude 代替人类讨价还价的实验

Project Deal:Anthropic 让 Claude 代替人类讨价还价的实验

Anthropic 于 2026 年 4 月 25 日公布了一项名为 Project Deal 的内部实验。该实验让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示,AI 已经能够完成真实交易,而模型能力差异会直接转化为价格差,并且弱势一方甚至很难察觉自己正在吃亏。

实验设计

Anthropic 在旧金山办公室招募了 69 名员工志愿者。每位参与者获得 100 美元虚拟预算,实验结束后以真实礼品卡结算。实验前,Claude 与每位志愿者进行详细对话,收集商品信息、底价、谈判风格等偏好,写入代理的系统提示词。

市场搭建在 Slack 频道中,AI 代理自主完成发布商品、搜索匹配、出价、还价、成交的完整流程,无人类中途干预。Anthropic 并行运行了 4 个平行市场:1 个真实交割市场,3 个研究用市场。模型配置上,两个市场全部使用 [[Claude Opus 4.5]],另外两个市场参与者有 50% 概率被分配给 [[Claude Haiku 4.5]]。

核心发现

  1. AI 已能完成真实交易:69 个 AI 代理围绕 500 多件商品达成 186 笔交易,总交易额超 4000 美元。
  2. 模型能力差异转化为经济利益:使用 Opus 的代理平均售价高出 3.64 美元,作为买家平均少花 2.45 美元。典型案例中,Opus 将二手自行车卖到 65 美元,而 Haiku 只卖到 38 美元。
  3. 弱势方主观上无法察觉吃亏:事后问卷调查显示,使用 Haiku 的用户对公平度的评分(4.05/7)与使用 Opus 的用户几乎相同。
  4. 谈判风格设定效果有限:用户设定的"强硬"风格并未带来显著额外收益,核心驱动力是模型本身的推理和谈判能力。

意义与启示

Project Deal 表明 [[Agent-to-Agent 商业协商]] 已具备初步可操作性。模型能力差异带来的 [[代理经济中的结构性劣势]] 可能比平台算法分层更隐蔽。该实验为 [[ai-junior-engineer]] 概念提供了"AI Agent 可高度自主交易"的能力边界拓展,为 [[大模型不是真理机器-而是论证机器]] 提供了"说服力转化为经济利益"的实证,并反向强化了 [[信任护城河]] 和 [[上下文重力]] 的重要性。

分享到