主页

0

你不是在用 Agent,你是在带一个"AI 初级工程师"团队

过去一年,很多人学会了一个新动作:把需求往 Claude、Cursor、Codex 里一丢,等它吐代码、吐方案、吐 PR。刚开始,所有人都觉得自己变快了。页面写得更快,脚本补得更快,测试样例生成得更快,连那些以前嫌麻烦、一直拖着不做的小修小补,也终于有人——或者说,有"东西"——帮你做了。 但真正进入生产环境后,很多团队很快碰到了同一个现实:写代码这件事变快了,交付并没有等比例变快。PR 变多了,review 变长了,测试压力更大了,返工更多了,团队里最贵的那批人,开始把时间花在"确认 AI 有没有闯祸"上,而不是继续往前推进关键设计。Faros AI 的研究很直接:高 AI 采用团队里,任务完成数和合并 PR 数都上去了,但 review 时间增加了 91%,PR 平均体量涨了 154%,bug 也在增加。Google 的 DORA 2025 报告更一针见血:AI 在软件开发里的主要作用,不是魔法,而是放大器。组织本来好的地方会被放大,组织本来烂的地方,也会被更快放大。(faros.ai)

0

通用 Agent 聪明但一碰真实世界就碎

在过去的一年里,整个科技圈都在为一个词沸腾——“全能智能体”(Autonomous Agents)。所有的创业企划书、技术大会和开源项目,都在描绘这样一个终极愿景:打造一个拥有自主思考能力的超级大脑。只需给它一个宏大的目标,它就能自行拆解任务、规划路径、调用工具,完美解决所有问题。 然而,Anthropic 核心技术团队的 Barry Zhang 与 Mahesh Murag 在最近的公开演讲中,却毫不留情地戳破了这个泡沫。他们向全球的开发者传递了一个极具颠覆性的信号:停止对全自动"超级智能体"的盲目崇拜,将战略重心转移到构建"技能包"(Skills)上。

0

赋能 AI 工作流:Claude Skill 全方位构建指南

在人工智能飞速发展的今天,如何让 AI 真正深入企业的业务逻辑,而不仅仅是一个聊天机器人?Claude 推出的 Skill(技能) 机制给出了答案。 什么是 Claude Skill? 简单来说,Skill 是一套封装在特定文件夹中的指令集,旨在教会 Claude 如何处理特定的任务或复杂的工作流。通过 Skill,你只需教导 Claude 一次,它就能在后续的所有对话中自动应用这些专业知识、流程偏好和领域技能,而无需你反复解释。

0

Claude Code 之父 Boris Cherny 的 69 条最佳实践:从 Vibe Coding 到 Agentic Engineering

在 AI 辅助编程领域,Claude Code 已成为无数开发者的生产力利器。而它的创造者 Boris Cherny,更是这个领域的标志性人物。Boris Cherny 是 Anthropic 公司 Claude Code 的创始人和负责人,此前曾在 Meta 担任 5 年 Principal Engineer。他是 O’Reilly 经典书籍《Programming TypeScript》的作者,自学成才的程序员背景让他对开发者痛点有着极深的理解。2025-2026 年间,Boris 在 X(Twitter)上多次分享 Claude Code 使用心得,这些碎片化经验被开发者 shanraisshan 整理成 GitHub 仓库 claude-code-best-practice,目前已获 42k+ Star,一度登顶全球 Trending。该仓库将 Boris 的智慧浓缩为 69 条最佳实践,系统分为 13 大类别,从提示工程到工作流 orchestration,帮助开发者从"凭感觉 coding"(vibe coding)转向结构化的"代理工程"(agentic engineering)。 本文将按仓库分类,逐一介绍这 69 条实践。每条实践后附简要解析、适用场景及反模式,避免读者"知其然不知其所以然"。这些实践的核心在于上下文管理、信任代理、减少微操,让 Claude 真正成为你的"超级同事"而非"打字机"。读完本文,你将获得一套可直接落地的 Claude Code 工作法,生产力提升 3-5 倍不是梦。

0

解耦"大脑"与"双手":Anthropic Managed Agents 如何定义下一代 AI 代理架构

在人工智能的演进史中,我们正处于一个从"对话机器人"向"自主代理(Agents)"跨越的关键节点。然而,构建一个能够长时间运行、处理复杂任务且具备鲁棒性的 Agent,其难度远超想象。 近日,Anthropic 发布了一篇深度技术博客,详细介绍了其 Managed Agents(托管代理)服务的底层架构设计哲学。这篇文章的核心论点在于:为了应对模型能力的快速迭代,必须通过虚拟化和解耦,将 Agent 的"大脑"(模型与逻辑控制)与"双手"(执行环境与工具)彻底分离。 本文将带你深入拆解 Anthropic 的这一架构思考,探讨它如何解决长程任务中的稳定性、安全性和可扩展性难题。

0

Gemini Robotics-ER 1.6:谷歌DeepMind推动机器人迈向真实世界智能新时代

在人工智能迅猛发展的今天,机器人不再是科幻电影中单纯执行预设程序的机械臂,而是需要真正"理解"物理世界的智能体。想象一下,一台机器人能在工厂车间自主巡逻,精确读取复杂的模拟压力表、液位计,甚至在多角度摄像头反馈下判断任务是否彻底完成;它还能在杂乱的工作台上准确找出指定工具,避免幻觉错误,同时严格遵守"不要搬动超过20公斤的重物"或"避免接触液体"的安全约束。这一切,正是谷歌DeepMind最新发布的Gemini Robotics-ER 1.6所带来的突破。 Gemini Robotics-ER系列是谷歌DeepMind专为具身智能(Embodied AI)设计的推理优先模型。ER代表"Embodied Reasoning",即具身推理,强调让AI从纯数字世界走向物理行动。1.6版本在1.5基础上实现了质的飞跃,尤其在视觉理解、空间推理和代理能力上大幅提升。它不再是简单的图像识别工具,而是集空间感知、世界知识和动态决策于一体的"机器人大脑"。通过与波士顿动力公司Spot机器人的深度合作,这一模型已能直接应用于工业巡检等高价值场景,标志着机器人从"执行者"向"思考者"的转变。

0

权力更迭:当 Anthropic 的光芒开始盖过 OpenAI 的"神话"

在硅谷,三年的时间足以让一家公司从"先驱"变成"传统势力"。 2026 年 4 月 14 日,TechCrunch 发表了一篇足以引发行业地震的深度报道:由于 Anthropic 的迅猛崛起,原本死心塌地追随 OpenAI 的部分顶级投资者,正在悄然收回他们的笃定,开始重新审视那张高达 8520 亿美元的估值支票。 如果说 2023 年是生成式 AI 的"创世纪",2024 年是"诸神黄昏"的预演,那么 2026 年的今天,我们正目睹一场真正的王座易主危机。曾经被视为不可撼动的 OpenAI,为何在今天让投资者产生了"二心"?而 Anthropic 又是如何通过一场优雅的"后发制人",完成了对行业老大的侧翼包抄?

0

The 2026 AI Engineer Roadmap 深度解析

这两年,很多人都在说自己做 AI:有人接了个大模型 API,套了个聊天框;有人把提示词打磨得越来越漂亮;也有人把"智能体"三个字贴到任何一个工作流上,仿佛项目瞬间就高级了。但 Rohit 在 《The 2026 AI Engineer Roadmap》 里抛出的判断很直接,也很刺耳:大多数开发者还在造玩具,而这个世界真正需要的是系统。 他反复强调,市场已经被各种薄薄一层的 GPT/Claude 套壳塞满了,这些东西不是壁垒,更像是下一次平台更新就会被顺手吞掉的功能。真正拉开差距的,不是谁更会写提示词,而是谁能把模型、工具、记忆、权限、恢复机制和真实业务拼成一个能活下来的系统。

0

一年跑掉250亿个Token的人,到底在用AI干什么?

这两天,Sigrid Jin 这个名字在开发者圈子里突然爆了。 原因很简单,也很夸张:《华尔街日报》公开提到,他在过去一年里,一个人就用掉了 250 亿个 Claude Code token。 这不是"偶尔用用 AI 写代码"的量级,也不是"重度订阅用户"的量级,而是一种近乎工业化的使用强度。更重要的是,这个数字背后,真正值得讨论的不是猎奇,不是炫耀,而是一个问题:一个人到底要做什么,才会把 AI 用到这种程度?

0

当机器人开始"拿下阵地":乌克兰前线,正在提前进入未来战争

如果说过去两年,俄乌战场最震撼世界的是无人机像雨点一样改变天空,那么 2026 年 4 月 13 日,乌克兰总统泽连斯基的那句话,则像是把"未来战争"又往前推了一大步。他在当天讲话中说,乌军首次完全依靠无人平台——包括无人机和地面机器人——夺取了俄军阵地,行动中没有步兵直接参与,乌方没有人员伤亡,而对方最终选择了投降。对很多人来说,这不是一句普通战报,而更像是一道分界线:战争的主角,正在从"士兵冲锋"悄悄转向"人机协同"。

0

AI-First 工程革命:CreaoAI 如何用 Agent 重塑生产流程,实现从"周"到"小时"的交付跃迁

2026年4月13日,CreaoAI 联合创始人 Peter Pang(前 Meta LLaMA 团队成员)在 X 上发布了一篇长帖,详细拆解了他们团队如何将 99% 的生产代码交给 AI 完成,并将完整功能从构思到上线压缩到一天内完成:上午 10 点上线新特性,中午 A/B 测试,下午 3 点根据数据下线,晚上 5 点上线优化版。三个月前,同样的周期需要六周。 这不是"装个 Cursor 用 Copilot 提效 10-20%“的 AI-assisted 故事,而是彻底的 AI-first 重构。Peter 将其称为 harness engineering(OpenAI 在 2026 年 2 月正式命名的概念):工程团队的核心工作不再是写代码,而是为 Agent 构建可读、可验证、可执行的"马具”(harness),让 AI 成为首要构建者,人类负责方向、批判和风险判断。 本文将从技术视角完整解读这篇帖子,拆解 CreaoAI 的架构重构、工具链、自愈闭环、新型工程角色,以及对整个行业的启示。目标是帮助正在或即将迈入 Agent 时代的工程师和 CTO 理解:真正的 10x 不是更快写代码,而是把整个系统设计成 AI 能"看懂、改好、自己修"的状态。

0

Aaron Levie:企业AI代理时代的洞见

Aaron Levie 是美国知名科技企业家,现任Box公司联合创始人兼首席执行官。Box是一家专注于企业云内容管理和协作平台的领先企业,服务于全球众多财富500强公司。Levie出生于1984年,早年从南加州大学辍学创业,以敏锐的商业洞察力和对云计算的长期押注闻名。在AI浪潮席卷全球的今天,他不仅持续推动Box向智能内容平台转型,还经常与企业IT和AI领导者深入交流,分享对行业趋势的观察。他的观点以务实、前瞻著称,强调技术如何真正服务于企业复杂现实,而非停留在实验室阶段。 最近,Levie与多家大型企业的IT和AI负责人进行了密集会谈,涵盖银行、媒体、零售、医疗、咨询、科技和体育等多个行业。这些对话聚焦于企业级AI代理(agents)的落地应用。他的观察清晰地勾勒出AI从"聊天时代"向"代理时代"转型的路径,以及企业在这一过程中面临的真实挑战与机遇。以下是基于这些洞见的详细阐述,旨在帮助读者理解AI如何重塑企业工作流程。