代码从来不是瓶颈：一位AI创业者对编程Agent的冷思考

2026-05-07

软件工程, 组织管理, 编程Agent, AI工具

摘要：当代码变得廉价，真正的瓶颈浮出水面——不是写代码的速度，而是人与人之间的共识。

最近，结构化生成领域的创业公司 .txt（dottxt）的CEO Rémi Louf 写了一篇博客，标题叫《The bottleneck was never the code》。这篇文章在技术圈引发了不小的讨论，因为它说了一个很多人隐约感觉到、但不太愿意承认的事实：

编程Agent让个人写代码快了10倍，但软件行业并没有因此快10倍。

这个矛盾困扰了他好几个月。他的结论是：代码从来就不是真正的瓶颈。

一个真实的故事

Louf 讲了一个自己的经历。他们团队有一个实验，拖了一年多没做——不是因为技术难，而是因为总有更紧急的事。上个月，他花了半小时把方法论讲给 Codex（OpenAI的编程Agent），几个小时后就拿到了一个能跑的第一版。

就这么简单。

但问题来了：如果写代码这么容易，为什么整个行业没有因此飞速前进？

50年前就有人说过的道理

1975年，Fred Brooks 在《人月神话》里就写过：往一个延期的项目里加人，只会让它更延期。1971年，Gerald Weinberg 在《程序开发心理学》里也说过类似的话。

软件，本质上是一群人谈判完之后留下的残留物。

代码当然重要，但它是更难的那部分工作的副产品，而不是工作本身。

过去50年，这个"残留物"足够贵，贵到我们所有注意力都放在它上面——打字速度、语言设计、框架选择、IDE插件、代码审查工具，全都是为了降低"残留物"的成本。

现在编程Agent把这个成本打到了地板价。于是我们终于看到了底下藏着的东西：人们试图达成共识。

而达成共识，和50年前一样难。

路线图才是真正的限制

当Agent接管了实现层，团队的瓶颈变成了什么？

变成了"写出足够精确的规格说明，让Agent能拿起来就跑"。

路线图，写下来。验收标准，写下来。“我们到底想要什么”，逼成精确的文字——无论是测试用例、工单，还是设计文档。

Louf 说，他认识的很多管理者现在被这件事压垮了。功能以前所未有的速度被实现，工程师不再等其他工程师了。他们在等下一个写得足够好的需求。

瓶颈从写代码的人，转移到了决定该写什么代码的人。也就是说：管理层。

杰文斯悖论：便宜了反而用得更多

经济学里有个概念叫杰文斯悖论：当某样东西变便宜了，你不会用得更少，而是用得更多。

当代码变得10倍便宜，我们不会只花原来10%的精力做同样的事。我们会把同样的精力花在以前"不值得做"的事情上。

三个月前"不值得花时间"的原型，现在一下午就能搞出来。解决了"没人真正有这个问题"的内部工具，被造出来然后被遗忘。

Louf 引用了乔布斯1997年的话：专注就是学会说不。 那一年苹果砍掉了70%的产品线，活下来的是那个学会了做减法的公司。

他说了一句很扎心的话：

每一个用Vibe Coding搞出来的、带12个功能的产品，离伟大只差砍掉11个功能。

Agent时代，做减法的纪律变得更难了——谁不喜欢"又发了一个新功能"的感觉呢？

上下文才是黄金

所有的协作都运行在一种人类很少主动思考的东西上：共享上下文（shared context）。

上下文是一个组织运转的基础原料。它是"我们在造什么、为什么重要、试过什么、谁决定了什么、什么是承重墙什么是装饰品"的共同理解。

人类团队通过"渗透"来积累上下文——在同一个房间里、读同一个Slack频道、凌晨两点一起调同一个故障。大部分上下文从来没有被写下来。当一个资深工程师review PR时说"这会搞坏迁移"，他调用的是没有任何文档记录的上下文。

Agent不会渗透。

它们不会因为"在房间里"而获得上下文，不会因为半听到了规划讨论而获得上下文，不会因为记得上次事故而获得上下文。你没有塞进prompt、文件树、工具或明确指令里的东西，它们就是没有。

没有上下文，Agent会对一个"略微偏了的问题版本"给出一个"看起来合理的答案"。

所以当 Louf 为自己团队的Agent做出了有用的东西而兴奋时，他的诚实复盘是：是我们做了上下文的工作。 下一个加入的工程师不会默认拥有这个画面。他们只有在团队认真把它写下来的情况下才会拥有。

一个有意思的解法

好消息是：Agent虽然不会渗透，但它们极其擅长穷举式阅读。

一个Agent会读完每一条PR评论、每一个关闭的issue、每一条commit message、每一份过时的设计文档、每一段Slack存档，然后提取出没人费心写下来的模式——因为以前没人会去读。

Louf 说他们已经在 .txt 开始做这件事了：让Agent爬遍代码库、issue、PR、讨论线程，生成一个知识库——记录那些隐含的决策、惯例、“我们为什么这么做”。不只是"这个模块存在"，而是"这个模块很奇怪，因为迁移时必须保留旧行为"，或者"这个benchmark很重要，因为之前的优化悄悄改变了分布"。

生产上下文的Agent + 消费上下文的Agent = 一个组织从来不会自己产出的书面基底。

当然，这个循环只能产出部分画面。正如哲学家 Michael Polanyi 说的：我们知道的比我们能说出来的多。有些承重上下文之所以存在，恰恰是因为它从未被文字化。

但"有用的起点"和"完全恢复"之间，前者可能就够了。

真正的护城河是组织能力

Louf 的最终结论：

未来十年赢的公司，不一定是模型最好的或Agent基础设施最好的。而是那些50人、200人、2000人的团队，能在产出更多的同时，保持对越来越少的核心决策的对齐。

这是文化和管理问题。一直都是。

每一代工具——IDE、版本控制、CI、微服务、DevOps——都承诺通过更好的工具解决协作问题。每一代最终都只是放大了组织本身已有的协调能力。小团队天然有一致性，所以放大器对它们总是正面的——这也是为什么最响亮的Agent布道者往往是小团队，而且他们对自己的情况说得基本没错。

但过了一定规模，一致性必须被主动生产和维护。放大器在两个方向上都变得更尖锐：好的组织变得更好，差的组织更快地把事情搞砸。

Agent是比之前所有工具都大得多的放大器。信号在两个方向上都会更响。

我的看法

读完这篇文章，我觉得 Louf 说到了一个很多技术人不愿意面对的点：

我们花了太多时间讨论"Agent能不能写出好代码"，花了太少时间讨论"我们能不能告诉Agent该写什么代码"。

前者是技术问题，后者是组织问题。而组织问题，从来都比技术问题难。

对于个人开发者来说，编程Agent确实是革命性的。但对于一个200人的工程团队来说，Agent更像是一面照妖镜——它会无情地暴露你的需求文档有多模糊、你的架构决策有多少是口口相传、你的团队共识有多脆弱。

代码变便宜了，但共识没有。

这可能是2025-2026年最值得所有技术管理者认真思考的一句话。

参考来源：Rémi Louf, “The bottleneck was never the code”, thetypicalset.com, 2026年5月

AI技术