METR研究:用了AI工具的老程序员反而慢了19%

 · 

AI安全研究组织METR做了一个实验,结论让不少人大跌眼镜:有经验的开发者使用AI编程工具后,完成任务的速度反而下降了19%。

实验设计

METR找了一批有经验的软件开发者,让他们在两种条件下完成相同的编程任务:

  • 实验组:可以自由使用AI编程工具
  • 对照组:不使用AI工具

任务涵盖了bug修复、功能开发、代码重构等常见开发场景。

为什么会更慢

研究发现主要有几个原因:

1. 审查成本
AI生成的代码不能盲目接受,需要逐行审查。有经验的开发者对代码质量要求高,花在审查和验证上的时间超过了AI节省的编写时间

2. 上下文切换
在自己思考和审查AI输出之间频繁切换,打断了开发者的思考流(flow state)。

3. 过度依赖倾向
一些开发者发现自己在AI给出建议后,会花时间”调教”AI而不是自己直接写——而直接写往往更快。

关键限制条件

这个研究有几个重要的限制:

  • 样本量不大
  • 任务类型有限
  • 使用的AI工具可能不是最新最强的版本
  • “有经验”的开发者本身就很快,提升空间小

对于初级开发者,AI工具的效率提升可能完全不同。METR的研究针对的是”有经验”这个群体,不能直接推广到所有开发者。

怎么理解

这个研究不是说AI编程工具没用,而是说效率提升不是自动的。需要学习正确的使用方式、在合适的场景下使用、建立有效的人机协作流程。

最好的开发者不是”使用AI最多”的人,而是知道什么时候该用、什么时候不该用的人。

参考来源:METR研究报告