AI安全研究组织METR做了一个实验,结论让不少人大跌眼镜:有经验的开发者使用AI编程工具后,完成任务的速度反而下降了19%。
实验设计
METR找了一批有经验的软件开发者,让他们在两种条件下完成相同的编程任务:
- 实验组:可以自由使用AI编程工具
- 对照组:不使用AI工具
任务涵盖了bug修复、功能开发、代码重构等常见开发场景。
为什么会更慢
研究发现主要有几个原因:
1. 审查成本
AI生成的代码不能盲目接受,需要逐行审查。有经验的开发者对代码质量要求高,花在审查和验证上的时间超过了AI节省的编写时间。
2. 上下文切换
在自己思考和审查AI输出之间频繁切换,打断了开发者的思考流(flow state)。
3. 过度依赖倾向
一些开发者发现自己在AI给出建议后,会花时间”调教”AI而不是自己直接写——而直接写往往更快。
关键限制条件
这个研究有几个重要的限制:
- 样本量不大
- 任务类型有限
- 使用的AI工具可能不是最新最强的版本
- “有经验”的开发者本身就很快,提升空间小
对于初级开发者,AI工具的效率提升可能完全不同。METR的研究针对的是”有经验”这个群体,不能直接推广到所有开发者。
怎么理解
这个研究不是说AI编程工具没用,而是说效率提升不是自动的。需要学习正确的使用方式、在合适的场景下使用、建立有效的人机协作流程。
最好的开发者不是”使用AI最多”的人,而是知道什么时候该用、什么时候不该用的人。
参考来源:METR研究报告