标签: AI Agent

0

MATLAB Agentic Toolkit到底解决了什么问题?一篇看懂MathWorks如何把工程软件接进AI Agent工作流

MathWorks新发布的MATLAB Agentic Toolkit,本质上不是一个简单的“让AI会写MATLAB代码”的插件,而是一套把MATLAB能力、工程知识和AI代理工作流绑定起来的基础设施。它一边通过MATLAB MCP Core Server给AI代理接上可执行的MATLAB环境,一边通过skills把MATLAB工程师的最佳实践注入代理,让AI不只是“会写几行.m文件”,而是能以更接近真实工程团队的方式完成建模、测试、诊断、应用开发与工具箱调用。

0

别把公司扒光给 AI 看:为什么“战略性不可读”会成为下一代护城河?

几乎所有创始人都在焦虑一件事:如何让公司对 AI 更“可读”。但一个更少人愿意面对的问题是,当你把内部知识、流程、判断逻辑和操作方式系统化、结构化、标准化时,你也可能正在亲手把自己的护城河翻译成供应商可以学习、复制和商品化的能力。你的优势,正在变成别人的功能。

0

一张3090,够不够撑起你的本地大模型?

在本地大模型玩家圈里,RTX 3090 仍然是一张极有代表性的“临界点显卡”。24GB 显存、成熟的软件生态和相对可承受的成本,让它成为很多人判断本地模型是否真正可用的一把尺子。问题是,一张3090到底能干什么,边界又在哪?

0

AI 工程师实战路线图

在 AI 浪潮席卷全球的当下,“AI 工程师”已经成为科技行业最炙手可热的高薪岗位之一。不同于传统机器学习研究者或数据科学家,AI 工程师的核心任务不是从头训练模型,而是把大语言模型真正落地到生产环境中,构建可靠、可扩展、可维护的完整系统。 这份路线图源于 Alexey Grigorev 的开源项目《AI Engineering Field Guide》。该项目分析了超过 2445 个职位 JD、5694 个职责描述和 4525 个实际用例,从中提炼出真正驱动 80% 工作产出的 20% 核心技能。对于想转型或进阶的工程师来说,这不是一份“概念清单”,而是一张非常务实的实战导航图。

0

Project Deal:Anthropic 让 Claude 代替人类讨价还价的实验

Anthropic 近期公布了一项名为 Project Deal 的内部实验,让 Claude 代理人类在 Slack 二手市场里自主买卖、议价与成交。结果显示,AI 已经能够完成真实交易,而模型能力差异会直接转化为价格差,并且弱势一方甚至很难察觉自己正在吃亏。

0

当 Claude、Codex 和 Onshape 开始直接生成 CAD,工业软件最先被颠覆的可能不是功能,而是那层复杂到令人窒息的界面

Adam-CAD 开源项目 CADAM、Onshape 与 Claude Opus 的联动案例,以及近期兴起的 text-to-CAD 工作流,正在揭示一个非常明确的趋势,大模型对工业软件的改造重点,不只是自动生成几何体,而是直接绕开传统 CAD 那套层层菜单、命令树和参数面板,把复杂界面压缩成可对话、可验证、可回溯的设计意图层。

0

不是每家公司都要做大模型,但每家公司都得重做产品入口

4月20日,Adobe在拉斯维加斯举办的Summit 2026上发布了CX Enterprise——一个全面Agent化的企业级客户体验编排平台。Adobe Experience Cloud被正式更名为CX Enterprise,内置AI Agent和全新的"Coworker"自主编排层。这不是一家AI创业公司的产品发布,而是一家年收入超200亿美元、服务全球超过20,000个品牌的传统软件巨头,用行动宣告了一个事实:AI不是在颠覆SaaS,AI正在成为SaaS本身。

0

企业真正难的,不是把Agent用起来,而是知道它什么时候做错了

这两年,几乎所有公司都在谈 Agent。 有人把它理解成"更聪明的聊天机器人",有人把它理解成"会自动干活的软件员工",也有人把它看成下一代企业操作系统的雏形。市场上的演示视频一个比一个惊艳:能自己拆任务,能调用工具,能读文档,能写代码,能跨系统操作,还能连续工作十几个小时不喊累。看上去,企业离"数字员工"只差最后一步。 但真正开始把 Agent 往生产环境里推的公司,很快就会发现,最难的从来不是把 Agent 跑起来,而是另一件更麻烦、也更现实的事:你得知道它到底在干什么,它为什么这么做,它是什么时候开始做错的,以及它做错以后,谁来负责。 这才是 2026 年企业 AI 最真实的分水岭。

0

你不是在用 Agent,你是在带一个"AI 初级工程师"团队

过去一年,很多人学会了一个新动作:把需求往 Claude、Cursor、Codex 里一丢,等它吐代码、吐方案、吐 PR。刚开始,所有人都觉得自己变快了。页面写得更快,脚本补得更快,测试样例生成得更快,连那些以前嫌麻烦、一直拖着不做的小修小补,也终于有人——或者说,有"东西"——帮你做了。 但真正进入生产环境后,很多团队很快碰到了同一个现实:写代码这件事变快了,交付并没有等比例变快。PR 变多了,review 变长了,测试压力更大了,返工更多了,团队里最贵的那批人,开始把时间花在"确认 AI 有没有闯祸"上,而不是继续往前推进关键设计。Faros AI 的研究很直接:高 AI 采用团队里,任务完成数和合并 PR 数都上去了,但 review 时间增加了 91%,PR 平均体量涨了 154%,bug 也在增加。Google 的 DORA 2025 报告更一针见血:AI 在软件开发里的主要作用,不是魔法,而是放大器。组织本来好的地方会被放大,组织本来烂的地方,也会被更快放大。(faros.ai)

0

通用 Agent 聪明但一碰真实世界就碎

在过去的一年里,整个科技圈都在为一个词沸腾——“全能智能体”(Autonomous Agents)。所有的创业企划书、技术大会和开源项目,都在描绘这样一个终极愿景:打造一个拥有自主思考能力的超级大脑。只需给它一个宏大的目标,它就能自行拆解任务、规划路径、调用工具,完美解决所有问题。 然而,Anthropic 核心技术团队的 Barry Zhang 与 Mahesh Murag 在最近的公开演讲中,却毫不留情地戳破了这个泡沫。他们向全球的开发者传递了一个极具颠覆性的信号:停止对全自动"超级智能体"的盲目崇拜,将战略重心转移到构建"技能包"(Skills)上。

0

Claude Code 之父 Boris Cherny 的 69 条最佳实践:从 Vibe Coding 到 Agentic Engineering

在 AI 辅助编程领域,Claude Code 已成为无数开发者的生产力利器。而它的创造者 Boris Cherny,更是这个领域的标志性人物。Boris Cherny 是 Anthropic 公司 Claude Code 的创始人和负责人,此前曾在 Meta 担任 5 年 Principal Engineer。他是 O’Reilly 经典书籍《Programming TypeScript》的作者,自学成才的程序员背景让他对开发者痛点有着极深的理解。2025-2026 年间,Boris 在 X(Twitter)上多次分享 Claude Code 使用心得,这些碎片化经验被开发者 shanraisshan 整理成 GitHub 仓库 claude-code-best-practice,目前已获 42k+ Star,一度登顶全球 Trending。该仓库将 Boris 的智慧浓缩为 69 条最佳实践,系统分为 13 大类别,从提示工程到工作流 orchestration,帮助开发者从"凭感觉 coding"(vibe coding)转向结构化的"代理工程"(agentic engineering)。 本文将按仓库分类,逐一介绍这 69 条实践。每条实践后附简要解析、适用场景及反模式,避免读者"知其然不知其所以然"。这些实践的核心在于上下文管理、信任代理、减少微操,让 Claude 真正成为你的"超级同事"而非"打字机"。读完本文,你将获得一套可直接落地的 Claude Code 工作法,生产力提升 3-5 倍不是梦。

0

解耦"大脑"与"双手":Anthropic Managed Agents 如何定义下一代 AI 代理架构

在人工智能的演进史中,我们正处于一个从"对话机器人"向"自主代理(Agents)"跨越的关键节点。然而,构建一个能够长时间运行、处理复杂任务且具备鲁棒性的 Agent,其难度远超想象。 近日,Anthropic 发布了一篇深度技术博客,详细介绍了其 Managed Agents(托管代理)服务的底层架构设计哲学。这篇文章的核心论点在于:为了应对模型能力的快速迭代,必须通过虚拟化和解耦,将 Agent 的"大脑"(模型与逻辑控制)与"双手"(执行环境与工具)彻底分离。 本文将带你深入拆解 Anthropic 的这一架构思考,探讨它如何解决长程任务中的稳定性、安全性和可扩展性难题。