标签: Agent

0

CEO到底该管几个人?

最近看到一个很有意思的对比。 英伟达的黄仁勋,据说直接管几十个人,很多问题拉到同一个场里公开讨论,不搞层层汇报,也很少做传统意义上的一对一管理。 Anthropic 的 Dario Amodei 则走了另一个极端:他几乎只管一个人,日常运营交给 Daniela Amodei,自己把大部分精力留给战略、研究方向、文化和长期问题。 关键不在 CEO 管几个人,而在组织能否自管理、自闭环 一个是"管很多人"。 一个是"几乎不管人"。 这两个看起来完全相反的答案,背后其实在回答同一个问题:CEO最稀缺的资源到底是什么? 我觉得答案不是权力,不是职位,也不是每天能开多少会,而是带宽。

0

把文档交给 LLM,为什么会越改越错?

一篇新论文提出,当我们让 LLM 长链路处理文档时,文档内容会发生逐步退化。更危险的是,这种退化常常“看起来还像原文档”,但数字、引用、结构、术语、关系和细节已经悄悄变了。

0

Grok 被一句“摩尔斯电码”骗走 17.5 万美元,这次事故到底是怎么发生的?

2026年5月,一名攻击者通过摩尔斯电码形式的提示注入,让 Grok 输出了一条转账指令,随后 Bankrbot 将这条文本当成真实授权执行,转走了约 17.5 万美元的 DRB 代币。虽然资金随后被归还,但这次事件把一个很多人还没真正意识到的风险讲透了:当大模型的自然语言输出被直接接到“能动钱”的系统上,问题就不再是聊天机器人出错,而是金融级事故。

0

你的AI系统为什么总是"Demo很惊艳,上线就崩"?因为你少了这五层

“每个人都在部署AI。很少有人部署对了。” —— 一位为50多家企业设计过AI架构的瑞士架构师 2026年,AI应用的门槛已经低到令人发指。一个周末,一个人,几行Prompt,就能搭出一个看起来很像样的AI产品。 但"看起来像样"和"真正能用"之间,隔着一道深渊。 这道深渊的名字叫:架构。 最近,一张在推特上疯传的AI系统架构图引发了广泛讨论。它把一个生产级AI系统拆成了五层:数据层、模型层、编排层、接口层、基础设施层。看起来简单,但每一层背后都藏着无数团队踩过的坑。 今天我们就来逐层拆解:一个真正能扛住生产环境的AI系统,到底长什么样?

0

深夜里的代码老虎机:AI 编程如何把开发者变成失眠的赌徒?

在近期的一期 Lenny’s Podcast 中,技术界老兵 Simon Willison 抛出了一系列关于 AI 编程时代冷酷而真实的洞察。他提到了一些我们正在经历、却尚未完全消化的巨变:编写代码本身不再是软件开发的瓶颈,测试和验证才是;UI 原型的试错成本正无限趋近于零;哪怕是在手机的小屏幕上,我们也能随手"捏"出可用的代码;而过去十年积累的关于项目工期估算的经验,在如今

0

谷歌Gemma 4开源模型系列:本地运行的前沿AI,代理工作流彻底改变游戏规则

2026年4月2日,Google DeepMind在X平台上正式发布Gemma 4开源模型家族。这一次,他们直接把"字节对字节最强开源模型"的标签打了出来。Gemma 4全系采用Apache 2.0许可协议,任何开发者、企业甚至个人都能自由下载、修改、商用、部署,完全没有以往开源模型常见的商业限制。这意味着,你可以在自己的笔记本电脑、手机甚至树莓派上运行曾经只有云端大模型才能

0

打造你的AI第二大脑:LLM驱动的个人知识库Agentic构建指南

在AI时代,信息如洪水般涌来:每天阅读的论文、文章、代码仓库、数据集和图像堆积成山。传统笔记工具如Notion或Obsidian虽能记录,但维护成本极高——手动创建链接、摘要、思维导图,容易陷入"知识孤岛"。而LLM(Large Language Model,大语言模型)的出现,彻底改变了游戏规则。它不再只是聊天工具,而是知识操作的核心引擎,能自动将原始数据转化为结构化、可查