Project Deal:Anthropic 让 Claude 代替人类讨价还价的实验
Anthropic 近期公布了一项名为 Project Deal 的内部实验,让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示,AI 已经能够完成真实交易,而模型能力差异会直接转化为价格差,并且弱势一方甚至很难察觉自己正在吃亏。
Anthropic 近期公布了一项名为 Project Deal 的内部实验,让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示,AI 已经能够完成真实交易,而模型能力差异会直接转化为价格差,并且弱势一方甚至很难察觉自己正在吃亏。
Google 宣布对 Anthropic 注入最高 400 亿美元战略投资,这不是一次普通风投,而是一场围绕 AGI 路线、算力基础设施与云生态主导权展开的三重阳谋。透过资本、TPU 与云服务三条线索,可以看到这笔交易真正改写的是未来十年的科技权力版图。
Google宣布向Anthropic投资最高400亿美元并提供5吉瓦算力,AI算力军备竞赛进入新阶段。Anthropic估值从3500亿美元飙升至8000亿美元以上,最快10月IPO。OpenAI同步扩大与Cerebras芯片合作,Claude Code质量问题引发用户反弹,AI基础设施竞争全面升级。
《光明日报》系统阐释“智能经济新形态”,定位新质生产力典型形态。数据要素市场化配置改革加速,全国数据年产量超40泽字节。Google向Anthropic投资最高400亿美元,布伦特原油重返百元大关,地缘博弈持续扰动全球市场。国家发改委进一步明确以超长期特别国债为抓手,加力推进“两重”“两新”建设,将其作为改造提升传统产业、培育新质生产力的重要物质支撑;数据要素领域则持续围绕数据与人工智能的双向赋能、打破数据鸿沟以及建设全国一体化数据市场展开。全球财经层面,地缘博弈与AI产业狂飙共同主导市场波动。
全球AI领域在底层安全机制、资本市场定价、政策监管走向及劳动力市场影响等方面发生了深远演变。Anthropic网络安全模型Mythos遭遇未经授权访问,资本市场上Anthropic隐含估值一度突破1万亿美元,科技巨头游说支出创历史新高,职场“AI鸿沟”迅速拉大,白宫则将大模型蒸馏上升为知识产权与国家安全议题。
Anthropic Claude Code 产品负责人 Cat Wu 面试了数百位 PM 后得出一个残酷结论:大多数产品经理依然活在旧世界里。当代码生成成本趋近于零,交付周期从半年压缩到一天,传统软件工程中那些被奉为圭臬的流程和角色,正在被无情地重构。
Mozilla 在 Firefox 150 版本中一次性修复了 271 个由 Anthropic Mythos 模型发现的安全漏洞。这不只是一个数字,它标志着软件安全审计正式进入 AI 工业化时代——防守方第一次有了赢的可能。
OpenAI发布生命科学专用推理模型GPT-Rosalind,聚焦生物学、药物发现与转化医学研究,标志着AI从通用大模型向垂直科学领域的深度渗透。Anthropic开始要求部分用户提交政府签发的身份证件和自拍照进行身份验证,以防止来自中国、俄罗斯等对手国家的未授权访问。OpenAI Codex持续迭代,新增IDE扩展和GitHub集成,AI编程智能体竞争进入白热化。GitHub宣布支持Claude和Codex第三方编程智能体的模型选择功能。
4月20日,亚马逊宣布向Anthropic追加投资50亿美元,并承诺在满足商业里程碑后继续追加至最高250亿美元。作为交换,Anthropic承诺未来十年在AWS上消费超过1000亿美元,并锁定最高5吉瓦的Trainium芯片算力。这不是一笔普通的融资新闻——它是AI竞争从模型能力比拼全面转向基础设施军备竞赛的标志性事件。当我们还在讨论哪个模型的benchmark更高时,真正的战争已经在电厂选址、芯片流片和数据中心扩建的工地上打响了。
最近有一条推文在科技圈引发热议: “Fun fact: Google owns 7% of SpaceX and 14% of Anthropic.” 这条信息经过核实是真的。而且当你顺着这条线索往下挖,会发现2026年最大的三场IPO——SpaceX、OpenAI、Anthropic——背后的投资回报图谱远比想象中复杂和精彩。 今天我们就来算一笔账:在这场合计近3万亿美元的超级IPO潮中,各路资本到底赚了多少?
国际人工智能领域的焦点高度集中在网络安全风险与大模型在垂直科研领域的能力突破上。Anthropic尚未公开发布的Claude Mythos模型因其极其强大的漏洞挖掘能力,引发了美国白宫、欧洲央行及全球金融界的强烈震动。同时Anthropic发布了Claude Opus 4.7及视觉协作工具Claude Design,OpenAI则推出了GPT-Rosalind进军生命科学。
过去一年,外界谈 AI,最热闹的话题几乎都围绕模型展开。谁的推理更强,谁的上下文更长,谁的多模态更完整,谁又在代码、搜索、Agent 上更进一步。表面上看,AI 产业像是在打模型大战;但如果把视角往下挖一层,就会发现真正决定胜负的东西,正在从模型能力,转向另一套更硬、更重、也更残酷的底层体系:芯片、算力、供电、网络,以及谁能把这些东西的成本打下来。 最近一连串新闻,几乎把这个趋势摆到了台面上。Meta 刚把与 Broadcom 的定制 AI 芯片合作延长到 2029 年;Google 也与 Broadcom 签了长期协议,共同开发未来几代定制 AI 芯片,协议一路延伸到 2031 年;Anthropic 一边加码 Google TPU 体系,一边又被曝正在评估自研芯片。热闹还在模型层,真正的战争却已经打到算力底盘上了。
国际AI领域在安全监管、B端市场竞争以及底层数据获取范式上出现了重大转折。Anthropic的最新网络安全模型"Mythos"因其能力过强引发了白宫与美国政府的介入与激烈博弈;OpenAI正全面转向企业级市场,计划推出代号为"Spud"的新一代推理模型以对抗Anthropic的蚕食。
全球人工智能领域在底层架构革新、核心商业路线分化以及安全伦理博弈上迎来了极为密集的动态。OpenAI大幅削减消费者端项目以聚焦企业级应用,并计划推出代号为“Spud”的全新推理模型;Anthropic正式发布Claude Opus 4.7,未公开的“Mythos”模型则因“过于强大”的公关策略引发强烈争议。
过去一年,很多人学会了一个新动作:把需求往 Claude、Cursor、Codex 里一丢,等它吐代码、吐方案、吐 PR。刚开始,所有人都觉得自己变快了。页面写得更快,脚本补得更快,测试样例生成得更快,连那些以前嫌麻烦、一直拖着不做的小修小补,也终于有人——或者说,有"东西"——帮你做了。 但真正进入生产环境后,很多团队很快碰到了同一个现实:写代码这件事变快了,交付并没有等比例变快。PR 变多了,review 变长了,测试压力更大了,返工更多了,团队里最贵的那批人,开始把时间花在"确认 AI 有没有闯祸"上,而不是继续往前推进关键设计。Faros AI 的研究很直接:高 AI 采用团队里,任务完成数和合并 PR 数都上去了,但 review 时间增加了 91%,PR 平均体量涨了 154%,bug 也在增加。Google 的 DORA 2025 报告更一针见血:AI 在软件开发里的主要作用,不是魔法,而是放大器。组织本来好的地方会被放大,组织本来烂的地方,也会被更快放大。(faros.ai)
在过去的一年里,整个科技圈都在为一个词沸腾——“全能智能体”(Autonomous Agents)。所有的创业企划书、技术大会和开源项目,都在描绘这样一个终极愿景:打造一个拥有自主思考能力的超级大脑。只需给它一个宏大的目标,它就能自行拆解任务、规划路径、调用工具,完美解决所有问题。 然而,Anthropic 核心技术团队的 Barry Zhang 与 Mahesh Murag 在最近的公开演讲中,却毫不留情地戳破了这个泡沫。他们向全球的开发者传递了一个极具颠覆性的信号:停止对全自动"超级智能体"的盲目崇拜,将战略重心转移到构建"技能包"(Skills)上。
在人工智能飞速发展的今天,如何让 AI 真正深入企业的业务逻辑,而不仅仅是一个聊天机器人?Claude 推出的 Skill(技能) 机制给出了答案。 什么是 Claude Skill? 简单来说,Skill 是一套封装在特定文件夹中的指令集,旨在教会 Claude 如何处理特定的任务或复杂的工作流。通过 Skill,你只需教导 Claude 一次,它就能在后续的所有对话中自动应用这些专业知识、流程偏好和领域技能,而无需你反复解释。
Anthropic Mythos模型引发国家级金融安全预警,美国财政部与美联储紧急磋商;Anthropic与OpenAI在AI责任法案上公开对立;CoreWeave因算力合作股价暴涨40%;Workday核心高管流失至Anthropic,传统SaaS面临底层替代危机。
在 AI 辅助编程领域,Claude Code 已成为无数开发者的生产力利器。而它的创造者 Boris Cherny,更是这个领域的标志性人物。Boris Cherny 是 Anthropic 公司 Claude Code 的创始人和负责人,此前曾在 Meta 担任 5 年 Principal Engineer。他是 O’Reilly 经典书籍《Programming TypeScript》的作者,自学成才的程序员背景让他对开发者痛点有着极深的理解。2025-2026 年间,Boris 在 X(Twitter)上多次分享 Claude Code 使用心得,这些碎片化经验被开发者 shanraisshan 整理成 GitHub 仓库 claude-code-best-practice,目前已获 42k+ Star,一度登顶全球 Trending。该仓库将 Boris 的智慧浓缩为 69 条最佳实践,系统分为 13 大类别,从提示工程到工作流 orchestration,帮助开发者从"凭感觉 coding"(vibe coding)转向结构化的"代理工程"(agentic engineering)。 本文将按仓库分类,逐一介绍这 69 条实践。每条实践后附简要解析、适用场景及反模式,避免读者"知其然不知其所以然"。这些实践的核心在于上下文管理、信任代理、减少微操,让 Claude 真正成为你的"超级同事"而非"打字机"。读完本文,你将获得一套可直接落地的 Claude Code 工作法,生产力提升 3-5 倍不是梦。
在人工智能的演进史中,我们正处于一个从"对话机器人"向"自主代理(Agents)"跨越的关键节点。然而,构建一个能够长时间运行、处理复杂任务且具备鲁棒性的 Agent,其难度远超想象。 近日,Anthropic 发布了一篇深度技术博客,详细介绍了其 Managed Agents(托管代理)服务的底层架构设计哲学。这篇文章的核心论点在于:为了应对模型能力的快速迭代,必须通过虚拟化和解耦,将 Agent 的"大脑"(模型与逻辑控制)与"双手"(执行环境与工具)彻底分离。 本文将带你深入拆解 Anthropic 的这一架构思考,探讨它如何解决长程任务中的稳定性、安全性和可扩展性难题。