Project Deal：Anthropic 让 Claude 代替人类讨价还价的实验

Anthropic 于 2026 年 4 月 25 日公布了一项名为 Project Deal 的内部实验。该实验让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示，AI 已经能够完成真实交易，而模型能力差异会直接转化为价格差，并且弱势一方甚至很难察觉自己正在吃亏。

实验设计

Anthropic 在旧金山办公室招募了 69 名员工志愿者。每位参与者获得 100 美元虚拟预算，实验结束后以真实礼品卡结算。实验前，Claude 与每位志愿者进行详细对话，收集商品信息、底价、谈判风格等偏好，写入代理的系统提示词。

市场搭建在 Slack 频道中，AI 代理自主完成发布商品、搜索匹配、出价、还价、成交的完整流程，无人类中途干预。Anthropic 并行运行了 4 个平行市场：1 个真实交割市场，3 个研究用市场。模型配置上，两个市场全部使用 [[Claude Opus 4.5]]，另外两个市场参与者有 50% 概率被分配给 [[Claude Haiku 4.5]]。

核心发现

AI 已能完成真实交易：69 个 AI 代理围绕 500 多件商品达成 186 笔交易，总交易额超 4000 美元。
模型能力差异转化为经济利益：使用 Opus 的代理平均售价高出 3.64 美元，作为买家平均少花 2.45 美元。典型案例中，Opus 将二手自行车卖到 65 美元，而 Haiku 只卖到 38 美元。
弱势方主观上无法察觉吃亏：事后问卷调查显示，使用 Haiku 的用户对公平度的评分（4.05/7）与使用 Opus 的用户几乎相同。
谈判风格设定效果有限：用户设定的"强硬"风格并未带来显著额外收益，核心驱动力是模型本身的推理和谈判能力。

意义与启示

Project Deal 表明 [[Agent-to-Agent 商业协商]] 已具备初步可操作性。模型能力差异带来的 [[代理经济中的结构性劣势]] 可能比平台算法分层更隐蔽。该实验为 [[ai-junior-engineer]] 概念提供了"AI Agent 可高度自主交易"的能力边界拓展，为 [[大模型不是真理机器-而是论证机器]] 提供了"说服力转化为经济利益"的实证，并反向强化了 [[信任护城河]] 和 [[上下文重力]] 的重要性。