Vibe Coding正在吞噬正经工程:Simon Willison的不安

摘要:当你不再审查AI写的每一行代码,你到底是在做"负责任的工程",还是在Vibe Coding?

最近,Simon Willison 在 Heavybit 的播客上说了一句让他自己都不太舒服的话:

“Vibe Coding 和 Agentic Engineering 正在合并,这让我很不安。”

Simon Willison 是谁?Django 框架的联合创始人,25年经验的资深工程师,开源项目 Datasette 的作者,也是目前英文技术圈里对AI编程工具写得最多、最深入的观察者之一。

他一直坚持一个清晰的分界线:Vibe Coding 是一回事,专业的 Agentic Engineering 是另一回事。但现在,他发现这条线在自己手里模糊了。

什么是 Vibe Coding?什么是 Agentic Engineering?

先说定义。

Vibe Coding:你不看代码。你可能根本不会编程。你告诉AI"给我做个东西",它做出来了,能用就行。不能用就告诉它"不对",然后祈祷。你不关心代码质量、安全性、可维护性。

Simon 的态度一直很明确:Vibe Coding 很棒——前提是你知道什么时候能用、什么时候不能用。给自己做个小工具,出了bug只伤自己?随便搞。给别人做软件?那是不负责任的。

Agentic Engineering:你是专业工程师,你懂安全、可维护性、性能、运维。你用AI工具来放大自己25年的经验。目标不是"更快地写出更烂的东西",而是"更快地写出更好的东西"。

这两个概念,他一直觉得泾渭分明。

直到最近。

那条线是怎么模糊的

Simon 坦白了一个事实:

“随着编程Agent越来越可靠,我已经不再审查它们写的每一行代码了——即使是生产级别的项目。”

他举了个例子:如果你让 Claude Code 写一个 JSON API 端点,跑一个 SQL 查询然后输出结果——它就是会做对。不会搞砸。你让它加自动化测试、加文档,它都会做得很好。

但他没有审查那些代码。

然后内疚感来了:如果我没审查代码,我把它用在生产环境里,这还算"负责任"吗?

他怎么说服自己的

Simon 找到了一个类比:在大公司里,别的团队交给你一个图片缩放服务,你会去读他们的每一行代码吗?不会。你看文档,试着用一下,能跑就行。出了问题再去翻他们的代码。

他开始用同样的方式对待AI Agent——把它当成"另一个团队"。

但他自己也承认这个类比有个致命缺陷:

人类团队有声誉。 他们会为自己的工作负责。写了烂代码会影响职业声誉。

Claude Code 没有职业声誉。它不会为自己的输出负责。

但它一直在"证明自己"——一次又一次地把简单的事情做对,用他喜欢的风格。

Simon 用了一个很精准的词来描述这种心理:偏差正常化(normalization of deviance)。每一次模型在你没仔细看的情况下写对了代码,你就会多信任它一点。直到某一天,你在不该信任的时候信任了它,然后翻车。

我们再也无法从外表判断软件质量

Simon 提出了一个更深层的问题:

以前,你在 GitHub 上看到一个仓库,有100个commit、漂亮的README、完善的自动化测试——你可以相当确定,作者在这个项目上花了大量心血。

现在,他半小时就能用AI搞出一个一模一样的东西。

100个commit、漂亮的README、每一行代码都有测试覆盖。看起来和那些精心打磨的项目完全一样。也许质量确实一样好。也许不是。他自己都分不清。

所以他得出了一个新的判断标准:

“比起测试和文档的质量,我更看重的是——有没有人真正用过这个东西。如果你有一个Vibe Coded的项目,但你每天都在用它,用了两周——这比你刚吐出来、几乎没跑过的东西有价值得多。”

使用时间 > 代码质量的表面指标。

这个判断标准的转变,本身就说明了很多。

瓶颈转移了

Simon 还提到了一个结构性变化:

如果你从每天写200行代码变成每天写2000行,整个软件开发生命周期的其他环节都会崩

因为整个流程——设计评审、代码审查、测试、部署——都是围绕"一天产出几百行代码"这个假设设计的。

他引用了 Anthropic 设计负责人 Jenny Wen 的一个观点:我们所有的设计流程都建立在"必须把设计做对,因为工程师花三个月做错了东西是灾难性的"这个前提上。

但如果做错了不需要三个月,而是三小时呢?那整个设计流程都可以变得更激进、更冒险,因为犯错的成本大幅降低了。

为什么他仍然不担心自己的职业

Simon 说了一句很实在的话:

“当我看我和Agent的对话记录,对绝大多数人来说这就是天书。”

AI编程工具是经验的放大器。你知道自己在做什么,才能跑得更快。

他还引用了政治评论员 Matthew Yglesias 的一条推文:

“五个月了,我想明白了:我不想自己Vibe Code——我想让专业管理的软件公司用AI编程辅助来做出更多、更好、更便宜的软件产品,然后卖给我。”

Simon 的评价是:这感觉差不多对。就像你可以看YouTube学会自己修水管,但你还是宁愿请个水管工。

我的看法

Simon 这篇文章最有价值的地方,不是他给出了什么答案,而是他诚实地暴露了一个正在发生的心理转变:

即使是最严谨的工程师,也在不知不觉中滑向"不审查就信任"。

这不是因为他们变懒了,而是因为AI确实在大多数时候做对了。问题是"大多数时候"和"每次"之间的差距,可能就是一个安全漏洞、一个数据泄露、一个生产事故。

偏差正常化是所有工程灾难的共同前奏。挑战者号航天飞机是这样炸的,波音737 MAX是这样掉的。每一次"没出事"都在强化"下次也不会出事"的信念。

AI编程工具的可靠性越高,这个陷阱就越隐蔽。

所以真正的问题不是"AI能不能写好代码"——它越来越能了。真正的问题是:当AI写的代码足够好到让你放松警惕时,你的审查机制还在吗?


参考来源:Simon Willison, “Vibe coding and agentic engineering are getting closer than I’d like”, simonwillison.net, 2026年5月6日

分享到