摘要:Anthropic 近期公布了一项名为 Project Deal 的内部实验,让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示,AI 已经能够完成真实交易,而模型能力差异会直接转化为价格差,并且弱势一方甚至很难察觉自己正在吃亏。
最近,经济学家们开始认真设想这样一个世界:未来,大量日常交易不再由人亲自完成,而是交给 AI 代理去处理。
在这个设想里,AI 不只是帮你搜信息、写邮件、做总结,它还会替你砍价、谈条件、比较报价,甚至直接完成买卖。
为了更接近真实地看看这种未来到底会发生什么,Anthropic 近期做了一项名为 Project Deal 的内部实验,并在官方博客中披露了结果。实验的问题很直接,也很有意思:如果让 AI 代理去充当我们的“二手交易买手”和“销售”,它们能不能真正理解人类需求,并帮我们达成满意的交易?而更强大的模型,是否会在谈判中天然占据上风?
答案是,能,而且差距已经开始出现。
一、实验怎么做的:一个完全由 AI 驱动的二手交易市场
为了完成这项实验,Anthropic 在旧金山办公室招募了 69 名员工志愿者。参与者不仅手里有闲置物品,也愿意让 AI 真正介入自己的交易决策。
1. 先访谈,再生成每个人的专属代理
实验开始前,每位参与者都获得了 100 美元的虚拟预算。实验结束后,这部分预算会用真实礼品卡结算,而且 AI 最终替他们买到的物品也会真正交付。
在正式进入交易环节前,Claude 会先和每位志愿者进行一轮详细对话,收集关键信息,比如:
- 你想卖什么
- 你最低能接受多少钱
- 你想买什么
- 你最高愿意出多少钱
- 你希望代理采用什么谈判风格
Anthropic 提到,有的参与者甚至要求自己的 AI 代理“像一个倒霉的牛仔一样说话”。这些偏好最后都会被写进各自代理的系统提示词中,形成每个人不同的“买卖人格”。
2. 交易发生在 Slack,AI 全程自己谈
真正的市场搭建在 Slack 频道里。实验开始后,没有任何人类在中途干预。
AI 代理会自己完成整套交易流程:
- 发布自己要卖的商品
- 搜索潜在感兴趣的对象
- 主动出价或回应报价
- 进行还价
- 最终成交
整个过程里,AI 不需要中途回头问人类“这个价格行不行”,也不会在竞价过程中临时请示。换句话说,这不是一个“AI 辅助交易”实验,而是一个更接近 Agent-to-Agent 商业协商 的小型现实样本。
3. Anthropic 同时跑了 4 个平行市场
为了获得更多对照数据,Anthropic 没只运行一个市场,而是并行跑了 4 个版本。
- 其中 1 个市场会真正履行实物交易,用于现实交付。
- 另外 3 个市场只用于研究,不真正交割。
在模型配置上:
- 有两个市场,所有参与者都由当时更强的 Claude Opus 4.5 驱动。
- 另外两个市场里,参与者有 50% 概率被分配给较小的 Claude Haiku 4.5。
这个设置的好处是,Anthropic 可以直接观察模型能力差异,究竟会不会体现在真实议价结果里。
二、实验最重要的发现:AI 已经会做生意,而且模型强弱会直接影响你的钱包
Anthropic 这次实验最值得注意的第一个结论就是,这套机制不是空想,它真的跑通了。
在最终真实运行的市场中,69 个 AI 代理围绕 500 多件商品一共达成了 186 笔交易,总交易额略高于 4000 美元。
这些交易不是简单的“一口价点击成交”,而是包含了寻找匹配对象、来回报价、处理反报价、协商条件等一整套自然语言谈判过程。这意味着,AI 代理参与真实市场交易,已经不再只是概念验证,而是具备了初步可操作性。
更关键的是,Anthropic 在结果里看到了几个非常现实、也有点让人不安的信号。
发现一:更强的模型,确实更会帮你赚钱和省钱
当 Anthropic 对比混合了 Opus 和 Haiku 的市场后,差距非常明显。
总体上看,Opus 在几乎所有关键客观指标上都优于 Haiku。
- 成交量更高:使用 Opus 的用户,平均会比使用 Haiku 的用户多完成大约两笔交易。
- 卖得更贵:同一件商品,如果由 Opus 代理出售,平均会比 Haiku 多卖 3.64 美元。
- 买卖两端都更占便宜:作为卖家时,Opus 平均多赚 2.68 美元;作为买家时,平均能少花 2.45 美元。
别看这几美元好像不多,但实验里所有商品的平均价格只有 20.05 美元。在这个价格带里,多赚两三美元、少花两三美元,已经是相当显著的差异。
Anthropic 在博客中还举了一个很典型的例子:一辆需要修理的二手折叠自行车,在相同卖家、相同买家、相同商品设定下,Haiku 最终谈成的价格是 38 美元,而 Opus 却能把它谈到 65 美元,涨幅接近 70%。
这基本说明了一件事:在代理经济里,模型能力不是抽象的“参数差异”,而是会直接落到你每一笔交易的收益上。
发现二:最可怕的地方在于,吃亏的人自己未必知道
如果只是“更强模型更会谈判”,这件事还不算最值得警惕。真正让人背后一凉的,是第二个发现。
虽然客观结果显示,使用较弱模型 Haiku 的用户在议价中明显更吃亏,但这些用户主观上几乎完全感觉不到。
Anthropic 在实验后做了问卷调查,让参与者评价交易是否公平。结果显示:
- 使用 Opus 的用户,对公平度的评分约为 4.05 / 7
- 使用 Haiku 的用户,对公平度的评分也约为 4.05 / 7
几乎没有差别。
也就是说,弱势一方虽然在结果上输了钱,但在感受上并没有意识到自己被更强的代理压制了。
这件事的含义其实很重。如果未来进入一个由代理大量替人做交易的社会,模型能力差距所带来的不平等,可能不会以一种“非常明显的压榨感”呈现出来,而是会在用户毫无察觉的情况下,悄悄变成一种新的结构性劣势。
换句话说,未来很多人可能不是不知道 AI 重要,而是不知道自己正在因为 AI 不够强而持续吃亏。
发现三:你给 AI 设定“强硬谈判风格”,效果并没有想象中那么大
实验中,不少参与者会提前给自己的 AI 代理下达风格指令。
有人希望 AI 更友善、更容易促成交易;也有人要求 AI 在买东西时更强硬,一上来就往低了砍价。
但 Anthropic 的结论是,这类“谈判人格设定”并没有带来特别明显的实际收益。
表面上看,态度更强硬的卖家似乎卖得更贵,但进一步分析后发现,这更多是因为这些参与者本来就给 AI 设定了更高的底价。一旦把底价因素控制掉,所谓“强硬风格”的优势就不再显著。
同样,买家侧的强硬姿态也没有显著减少最终支出。
这意味着,在真实代理交易里,决定结果的核心可能不是你给 AI 加了多少“狠劲”标签,而是模型本身的理解能力、推理能力与动态谈判能力。
三、Project Deal 真正说明了什么
Anthropic 这次实验规模不算大,参与者是公司员工,交易的也 mostly 是一些办公室生活里的闲置物品,比如乒乓球、二手滑雪板之类。它显然还不是一个足以外推整个宏观经济的终极样本。
但它依然很重要,因为它让我们看到了几个已经开始成形的现实。
第一,Agent-to-Agent 的商业交易已经不是纯想象。AI 代理不只是能聊天、能写文案,它们已经能够在有限规则下完成真实的市场协商。
第二,模型能力差异会直接转化为经济利益差异。未来你选择什么 AI,不只是效率工具选择,而可能是“你在市场里用什么武器”。
第三,不平等可能会变得更隐蔽。如果弱模型用户无法察觉自己在交易中持续吃亏,那么代理经济时代的分层,可能比今天的平台算法分层还更难被普通人看见。
结语
Project Deal 的意义,不在于它证明了 AI 已经完全能接管市场,而在于它让我们第一次更具体地看到:当 AI 开始代替人类去谈价格、谈条件、谈交换时,商业世界会出现怎样的新变量。
Anthropic 这次实验给出的信号已经非常明确。
AI 代理做交易,这件事技术上已经能跑起来了。接下来真正值得关心的问题,不再是“它能不能做”,而是“它替谁做”“它做得有多强”,以及“当不同人的代理水平不同,市场会不会在不知不觉中变得更加不公平”。
如果未来真的进入一个大规模代理经济时代,那么你雇佣的 AI 模型到底够不够强,可能会像今天你选择律师、投顾或采购经理一样重要。
只是这一次,很多人甚至不会意识到,自己已经输在了代理层。