2024年AI编程有多强?谷歌工程主管揭秘残酷真相

文章转载于新智元

2024年,AI编程已然渗透了各行各业,影响着软件的整个生命周期。

那么问题来了,AI coding用过都说好,但我们平时用的软件咋感觉没啥进步呢?

近日,Addy Osmani,谷歌的工程主管,同时也是一位亚马逊畅销书作家,为我们揭示了AI辅助编码在一线开发中的真实情况。

1

码农怎么用AI?

一般来说,团队利用AI进行开发有两种不同的模式:「引导程序(bootstrappers)」 和 「迭代器(iterators)」。两者都在帮助工程师(甚至是非技术用户)缩小从想法到执行的差距。

Bootstrappers

这一类包括Bolt, v0, 和screenshot-to-code等AI工具,其特点为:

这样的工作流令人印象深刻。比如一位独立开发人员可以使用Bolt,在短时间内将Figma设计转变为有效的Web应用程序。尽管达不到生产级别的要求,但用来获得初步的用户反馈绰绰有余。

Iterators

这一类主要负责日常开发工作流程,包括Cursor、Cline、Copilot和WindSurf等工具,效果没有上面那么浮夸,但更加实在,比如:

虽然这两种方法都可以大大加快开发速度,但「天下没有免费的午餐」。

「AI速度」的隐性成本

高级工程师使用Cursor或Copilot等AI工具,可以在几分钟内搭建整个功能的基架,并完成测试和文档,就像变魔术一样。

但仔细观察就会发现,在参考AI建议的同时,资深工程师们还会:

换句话说,他们正在用多年积累的工程智慧,塑造和限制AI的输出。AI负责加速代码实现,但人类的专业知识确保代码的可维护性。

而初级工程师就经常错过这些关键步骤。他们更容易接受AI的输出,从而导致所谓的「纸牌屋代码(house of cards code)」——看起来很完整,但在现实世界的压力下会崩溃。

知识悖论

所以实际上,相比于初学者,AI反而更能帮助有经验的开发人员,——这多少有点反直觉。

高级工程师利用AI快速构建想法的原型(理解)、生成基本实现(可改进)、探索已知问题的替代方法等等;

而初学者却经常接受不正确或过时的解决方案、忽略关键的安全性和性能问题、不知道如何调试AI生成的代码,最终构建了一个自己不完全理解的脆弱系统。

1

70% problem

使用AI进行编码的非工程师,经常遇到一个窘境:他们可以出人意料地迅速完成70%的工作,但最后的30%就相当痛苦了。

「70% problem」揭示了AI辅助开发的现状,刚开始如有神助,后来被现实按在地上摩擦。

实际情况通常是:

这个循环对于非工程师来说尤其痛苦,因为他们缺乏专业知识来理解真正出了什么问题。

有经验的开发人员遇到bug时,可以根据多年的模式识别来推理潜在原因和解决方案。如果没有这个背景,那基本上就是在用自己不完全理解的代码「打地鼠」。

学习悖论

还有一个更深层次的问题:让非工程师使用AI编码工具,实际上可能会阻碍学习。

代码生成了、运行了,但「开发者」不了解基本原理,此时,他错过了学习基本模式、没有培养调试技能、无法对架构决策进行推理,而这份代码又需要维护和扩展。

于是,「开发者」不断返回AI来解决问题,而没有培养自己处理问题的专业能力。

非工程师使用AI编码工具的最好方式可能是「混合模式」:

但这需要耐心和奉献精神,与许多人使用AI工具的目标恰恰相反。

「70% problem」表明,当前的AI还不是许多人希望的那个AI。最后30%的工作(使软件可用于生产、可维护等),仍然需要真正的工程知识。

最佳实践

Addy Osmani观察了几十个团队,总结了一些最佳实践方式:

「AI初稿」模式

「持续对话」模式

「信任但验证」模式

1

AI的真正前景?

尽管存在这些挑战,但作者对AI在软件开发中的作用持乐观态度。关键是要充分利用AI的真正优势:

加速已知AI擅长帮助实现我们已经了解的模式,就像有一个无限耐心的结对程序员,他可以非常快速地打字。

探索可能性AI非常适合快速构建想法原型和探索不同的方法,就像一个沙箱,我们可以在其中快速测试概念。

自动化例程AI大大减少了花在样板和日常编码任务上的时间,让我们可以专注于有趣的问题。

如果您刚刚开始AI辅助开发,作者的建议是,先从小处着手。

将AI用于非耦合的、定义明确的任务,查看生成的每一行代码,逐渐构建更大的功能。

过程中保持模块化:将所有内容分解为小的重点文件,在组件之间保持清晰的接口,记录模块的边界。

重要的一点是,相信自己的经验:AI用来加速而不能取代你的判断、感觉不对劲时要质疑、时刻维护自己的工程标准。

Agent兴起

随着我们进入2025年,AI辅助开发的格局正在发生巨大变化。虽然当前的工具已经改变了原型设计和迭代方式,但我们正处于更重要转型的风口浪尖:智能体(Agent)软件工程的兴起。

智能体系统不仅可以响应提示,还将以越来越高的自主性规划、执行和迭代解决方案。

比如Anthropic的Claude能够使用计算机,或者Cline自动启动浏览器和运行测试的能力。

在调试过程中,智能体系统不仅给出修复bug的建议,还可以:

主动识别潜在问题、启动和运行测试套件、检查UI元素并捕获屏幕截图、提出并实施修复、验证解决方案是否有效。

下一代工具将可以无缝集成视觉理解(UI 屏幕截图、模型、图表)、口头语言对话和环境交互(浏览器、终端、API)。

未来的AI不是取代开发人员,而是成为一个越来越有能力的协作者,既可以采取主动,又能尊重人类的指导和专业知识。

参考资料:

https://addyo.substack.com/p/the-70-problem-hard-truths-about