上个时代的开发工具,是被非常仔细地一步步打磨出来的:行为稳定,交互克制,出了问题大多也在预期之内。可到了今天,Claude Code、Codex 这些软件产品,把“用 AI 写自己”当成默认路线。虽然 AI 的确让写代码更快了,但它并没有自动解决“怎样把一个复杂的软件长期维护好”这件事。 Claude Code 是一个很典型的例子。Anthropic 这套工具几乎是从零开始做的,但团队又长期坚持一种非常激进的内部方式:他们强调“Claude Code 的 100% 代码都要由 Claude Code 自己写”,并且内部工程师和研究人员的各项任务,从大型代码重构、squash commit,到各种琐碎的编码工作,都依赖Claude Code。 问题在于,当底层模型本身就是非确定性的,而承载这些能力的产品代码又是在这样的开发方式下快速堆叠出来的,系统很容易陷入一种恶性循环。这一两年里,Claude Code 一直在快速扩展能力,交互逻辑越来越复杂,于是这个产品本身变得越来越不稳定:各种崩溃、各种诡异报错,bug 越来越多,速度越来越慢。 事情甚至发展到一种颇为荒谬的状态——与其...
