Vibe Coding正在吞噬正经工程：Simon Willison的不安

2026-05-07

软件工程, Claude Code, Vibe Coding, 编程Agent

摘要：当你不再审查AI写的每一行代码，你到底是在做"负责任的工程"，还是在Vibe Coding？

最近，Simon Willison 在 Heavybit 的播客上说了一句让他自己都不太舒服的话：

“Vibe Coding 和 Agentic Engineering 正在合并，这让我很不安。”

Simon Willison 是谁？Django 框架的联合创始人，25年经验的资深工程师，开源项目 Datasette 的作者，也是目前英文技术圈里对AI编程工具写得最多、最深入的观察者之一。

他一直坚持一个清晰的分界线：Vibe Coding 是一回事，专业的 Agentic Engineering 是另一回事。但现在，他发现这条线在自己手里模糊了。

什么是 Vibe Coding？什么是 Agentic Engineering？

先说定义。

Vibe Coding：你不看代码。你可能根本不会编程。你告诉AI"给我做个东西"，它做出来了，能用就行。不能用就告诉它"不对"，然后祈祷。你不关心代码质量、安全性、可维护性。

Simon 的态度一直很明确：Vibe Coding 很棒——前提是你知道什么时候能用、什么时候不能用。给自己做个小工具，出了bug只伤自己？随便搞。给别人做软件？那是不负责任的。

Agentic Engineering：你是专业工程师，你懂安全、可维护性、性能、运维。你用AI工具来放大自己25年的经验。目标不是"更快地写出更烂的东西"，而是"更快地写出更好的东西"。

这两个概念，他一直觉得泾渭分明。

直到最近。

那条线是怎么模糊的

Simon 坦白了一个事实：

“随着编程Agent越来越可靠，我已经不再审查它们写的每一行代码了——即使是生产级别的项目。”

他举了个例子：如果你让 Claude Code 写一个 JSON API 端点，跑一个 SQL 查询然后输出结果——它就是会做对。不会搞砸。你让它加自动化测试、加文档，它都会做得很好。

但他没有审查那些代码。

然后内疚感来了：如果我没审查代码，我把它用在生产环境里，这还算"负责任"吗？

他怎么说服自己的

Simon 找到了一个类比：在大公司里，别的团队交给你一个图片缩放服务，你会去读他们的每一行代码吗？不会。你看文档，试着用一下，能跑就行。出了问题再去翻他们的代码。

他开始用同样的方式对待AI Agent——把它当成"另一个团队"。

但他自己也承认这个类比有个致命缺陷：

人类团队有声誉。 他们会为自己的工作负责。写了烂代码会影响职业声誉。

Claude Code 没有职业声誉。它不会为自己的输出负责。

但它一直在"证明自己"——一次又一次地把简单的事情做对，用他喜欢的风格。

Simon 用了一个很精准的词来描述这种心理：偏差正常化（normalization of deviance）。每一次模型在你没仔细看的情况下写对了代码，你就会多信任它一点。直到某一天，你在不该信任的时候信任了它，然后翻车。

我们再也无法从外表判断软件质量

Simon 提出了一个更深层的问题：

以前，你在 GitHub 上看到一个仓库，有100个commit、漂亮的README、完善的自动化测试——你可以相当确定，作者在这个项目上花了大量心血。

现在，他半小时就能用AI搞出一个一模一样的东西。

100个commit、漂亮的README、每一行代码都有测试覆盖。看起来和那些精心打磨的项目完全一样。也许质量确实一样好。也许不是。他自己都分不清。

所以他得出了一个新的判断标准：

“比起测试和文档的质量，我更看重的是——有没有人真正用过这个东西。如果你有一个Vibe Coded的项目，但你每天都在用它，用了两周——这比你刚吐出来、几乎没跑过的东西有价值得多。”

使用时间 > 代码质量的表面指标。

这个判断标准的转变，本身就说明了很多。

瓶颈转移了

Simon 还提到了一个结构性变化：

如果你从每天写200行代码变成每天写2000行，整个软件开发生命周期的其他环节都会崩。

因为整个流程——设计评审、代码审查、测试、部署——都是围绕"一天产出几百行代码"这个假设设计的。

他引用了 Anthropic 设计负责人 Jenny Wen 的一个观点：我们所有的设计流程都建立在"必须把设计做对，因为工程师花三个月做错了东西是灾难性的"这个前提上。

但如果做错了不需要三个月，而是三小时呢？那整个设计流程都可以变得更激进、更冒险，因为犯错的成本大幅降低了。

为什么他仍然不担心自己的职业

Simon 说了一句很实在的话：

“当我看我和Agent的对话记录，对绝大多数人来说这就是天书。”

AI编程工具是经验的放大器。你知道自己在做什么，才能跑得更快。

他还引用了政治评论员 Matthew Yglesias 的一条推文：

“五个月了，我想明白了：我不想自己Vibe Code——我想让专业管理的软件公司用AI编程辅助来做出更多、更好、更便宜的软件产品，然后卖给我。”

Simon 的评价是：这感觉差不多对。就像你可以看YouTube学会自己修水管，但你还是宁愿请个水管工。

我的看法

Simon 这篇文章最有价值的地方，不是他给出了什么答案，而是他诚实地暴露了一个正在发生的心理转变：

即使是最严谨的工程师，也在不知不觉中滑向"不审查就信任"。

这不是因为他们变懒了，而是因为AI确实在大多数时候做对了。问题是"大多数时候"和"每次"之间的差距，可能就是一个安全漏洞、一个数据泄露、一个生产事故。

偏差正常化是所有工程灾难的共同前奏。挑战者号航天飞机是这样炸的，波音737 MAX是这样掉的。每一次"没出事"都在强化"下次也不会出事"的信念。

AI编程工具的可靠性越高，这个陷阱就越隐蔽。

所以真正的问题不是"AI能不能写好代码"——它越来越能了。真正的问题是：当AI写的代码足够好到让你放松警惕时，你的审查机制还在吗？

参考来源：Simon Willison, “Vibe coding and agentic engineering are getting closer than I’d like”, simonwillison.net, 2026年5月6日

AI技术