Project Deal：Anthropic 让 Claude 代替人类讨价还价的实验

2026-04-25

AI Agent, Anthropic, Claude

摘要：Anthropic 近期公布了一项名为 Project Deal 的内部实验，让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示，AI 已经能够完成真实交易，而模型能力差异会直接转化为价格差，并且弱势一方甚至很难察觉自己正在吃亏。

最近，经济学家们开始认真设想这样一个世界：未来，大量日常交易不再由人亲自完成，而是交给 AI 代理去处理。

在这个设想里，AI 不只是帮你搜信息、写邮件、做总结，它还会替你砍价、谈条件、比较报价，甚至直接完成买卖。

为了更接近真实地看看这种未来到底会发生什么，Anthropic 近期做了一项名为 Project Deal 的内部实验，并在官方博客中披露了结果。实验的问题很直接，也很有意思：如果让 AI 代理去充当我们的“二手交易买手”和“销售”，它们能不能真正理解人类需求，并帮我们达成满意的交易？而更强大的模型，是否会在谈判中天然占据上风？

答案是，能，而且差距已经开始出现。

一、实验怎么做的：一个完全由 AI 驱动的二手交易市场

为了完成这项实验，Anthropic 在旧金山办公室招募了 69 名员工志愿者。参与者不仅手里有闲置物品，也愿意让 AI 真正介入自己的交易决策。

1. 先访谈，再生成每个人的专属代理

实验开始前，每位参与者都获得了 100 美元的虚拟预算。实验结束后，这部分预算会用真实礼品卡结算，而且 AI 最终替他们买到的物品也会真正交付。

在正式进入交易环节前，Claude 会先和每位志愿者进行一轮详细对话，收集关键信息，比如：

你想卖什么
你最低能接受多少钱
你想买什么
你最高愿意出多少钱
你希望代理采用什么谈判风格

Anthropic 提到，有的参与者甚至要求自己的 AI 代理“像一个倒霉的牛仔一样说话”。这些偏好最后都会被写进各自代理的系统提示词中，形成每个人不同的“买卖人格”。

2. 交易发生在 Slack，AI 全程自己谈

真正的市场搭建在 Slack 频道里。实验开始后，没有任何人类在中途干预。

AI 代理会自己完成整套交易流程：

发布自己要卖的商品
搜索潜在感兴趣的对象
主动出价或回应报价
进行还价
最终成交

整个过程里，AI 不需要中途回头问人类“这个价格行不行”，也不会在竞价过程中临时请示。换句话说，这不是一个“AI 辅助交易”实验，而是一个更接近 Agent-to-Agent 商业协商 的小型现实样本。

3. Anthropic 同时跑了 4 个平行市场

为了获得更多对照数据，Anthropic 没只运行一个市场，而是并行跑了 4 个版本。

其中 1 个市场会真正履行实物交易，用于现实交付。
另外 3 个市场只用于研究，不真正交割。

在模型配置上：

有两个市场，所有参与者都由当时更强的 Claude Opus 4.5 驱动。
另外两个市场里，参与者有 50% 概率被分配给较小的 Claude Haiku 4.5。

这个设置的好处是，Anthropic 可以直接观察模型能力差异，究竟会不会体现在真实议价结果里。

二、实验最重要的发现：AI 已经会做生意，而且模型强弱会直接影响你的钱包

Anthropic 这次实验最值得注意的第一个结论就是，这套机制不是空想，它真的跑通了。

在最终真实运行的市场中，69 个 AI 代理围绕 500 多件商品一共达成了 186 笔交易，总交易额略高于 4000 美元。

这些交易不是简单的“一口价点击成交”，而是包含了寻找匹配对象、来回报价、处理反报价、协商条件等一整套自然语言谈判过程。这意味着，AI 代理参与真实市场交易，已经不再只是概念验证，而是具备了初步可操作性。

更关键的是，Anthropic 在结果里看到了几个非常现实、也有点让人不安的信号。

发现一：更强的模型，确实更会帮你赚钱和省钱

当 Anthropic 对比混合了 Opus 和 Haiku 的市场后，差距非常明显。

总体上看，Opus 在几乎所有关键客观指标上都优于 Haiku。

成交量更高：使用 Opus 的用户，平均会比使用 Haiku 的用户多完成大约两笔交易。
卖得更贵：同一件商品，如果由 Opus 代理出售，平均会比 Haiku 多卖 3.64 美元。
买卖两端都更占便宜：作为卖家时，Opus 平均多赚 2.68 美元；作为买家时，平均能少花 2.45 美元。

别看这几美元好像不多，但实验里所有商品的平均价格只有 20.05 美元。在这个价格带里，多赚两三美元、少花两三美元，已经是相当显著的差异。

Anthropic 在博客中还举了一个很典型的例子：一辆需要修理的二手折叠自行车，在相同卖家、相同买家、相同商品设定下，Haiku 最终谈成的价格是 38 美元，而 Opus 却能把它谈到 65 美元，涨幅接近 70%。

这基本说明了一件事：在代理经济里，模型能力不是抽象的“参数差异”，而是会直接落到你每一笔交易的收益上。

发现二：最可怕的地方在于，吃亏的人自己未必知道

如果只是“更强模型更会谈判”，这件事还不算最值得警惕。真正让人背后一凉的，是第二个发现。

虽然客观结果显示，使用较弱模型 Haiku 的用户在议价中明显更吃亏，但这些用户主观上几乎完全感觉不到。

Anthropic 在实验后做了问卷调查，让参与者评价交易是否公平。结果显示：

使用 Opus 的用户，对公平度的评分约为 4.05 / 7
使用 Haiku 的用户，对公平度的评分也约为 4.05 / 7

几乎没有差别。

也就是说，弱势一方虽然在结果上输了钱，但在感受上并没有意识到自己被更强的代理压制了。

这件事的含义其实很重。如果未来进入一个由代理大量替人做交易的社会，模型能力差距所带来的不平等，可能不会以一种“非常明显的压榨感”呈现出来，而是会在用户毫无察觉的情况下，悄悄变成一种新的结构性劣势。

换句话说，未来很多人可能不是不知道 AI 重要，而是不知道自己正在因为 AI 不够强而持续吃亏。

发现三：你给 AI 设定“强硬谈判风格”，效果并没有想象中那么大

实验中，不少参与者会提前给自己的 AI 代理下达风格指令。

有人希望 AI 更友善、更容易促成交易；也有人要求 AI 在买东西时更强硬，一上来就往低了砍价。

但 Anthropic 的结论是，这类“谈判人格设定”并没有带来特别明显的实际收益。

表面上看，态度更强硬的卖家似乎卖得更贵，但进一步分析后发现，这更多是因为这些参与者本来就给 AI 设定了更高的底价。一旦把底价因素控制掉，所谓“强硬风格”的优势就不再显著。

同样，买家侧的强硬姿态也没有显著减少最终支出。

这意味着，在真实代理交易里，决定结果的核心可能不是你给 AI 加了多少“狠劲”标签，而是模型本身的理解能力、推理能力与动态谈判能力。

三、Project Deal 真正说明了什么

Anthropic 这次实验规模不算大，参与者是公司员工，交易的也 mostly 是一些办公室生活里的闲置物品，比如乒乓球、二手滑雪板之类。它显然还不是一个足以外推整个宏观经济的终极样本。

但它依然很重要，因为它让我们看到了几个已经开始成形的现实。

第一，Agent-to-Agent 的商业交易已经不是纯想象。AI 代理不只是能聊天、能写文案，它们已经能够在有限规则下完成真实的市场协商。

第二，模型能力差异会直接转化为经济利益差异。未来你选择什么 AI，不只是效率工具选择，而可能是“你在市场里用什么武器”。

第三，不平等可能会变得更隐蔽。如果弱模型用户无法察觉自己在交易中持续吃亏，那么代理经济时代的分层，可能比今天的平台算法分层还更难被普通人看见。

结语

Project Deal 的意义，不在于它证明了 AI 已经完全能接管市场，而在于它让我们第一次更具体地看到：当 AI 开始代替人类去谈价格、谈条件、谈交换时，商业世界会出现怎样的新变量。

Anthropic 这次实验给出的信号已经非常明确。

AI 代理做交易，这件事技术上已经能跑起来了。接下来真正值得关心的问题，不再是“它能不能做”，而是“它替谁做”“它做得有多强”，以及“当不同人的代理水平不同，市场会不会在不知不觉中变得更加不公平”。

如果未来真的进入一个大规模代理经济时代，那么你雇佣的 AI 模型到底够不够强，可能会像今天你选择律师、投顾或采购经理一样重要。

只是这一次，很多人甚至不会意识到，自己已经输在了代理层。

AI技术