别再问 测试会不会被AI取代了 ——2026年数据告诉你:QA才是最后防线
感受
我最近用 opencode 搭建了一个完整的应用。
整个过程中,我大部分的精力其实都在做3件事情。
- 像产品经理一样设计功能和交互
- 像测试人员一样验证产品的功能及交互
- 不停的发现bug,提出缺陷,然后跟AI一起配合修复问题
这么反复循环了几次之后,我最终意识到:AI极大地降低了实现的门槛,却成倍放大了验证的难度和重要性。
用AI进行编码,实现代码确实是唾手可得了,但是验证的过程却是没有办法省略的。
AI在进行逻辑实现的时候,如果需求描述的不是很明确,那么一些实现细节是一定会遗漏的,这点跟现存的软件开发是类似的。
需求缺乏细节,那么只有用反复的测试来弥补。
比如我要实现一个需求,大致描述一番之后,AI会给出它的实现思路,然后让我们进行选择。
我们任意选择一个选项之后,很多的细节其实是AI自己去把控的,功能看似可以完成,但不一定跟我们的初衷相符,所以要反复测试和修改才可以真正达到可用以及正确的状态。
这其实让我意识到: 生产力工具越强大,对质量把控的要求可能就要越高。
毕竟现在需求可以实现的很快,但是要又快又好,很多细节和问题都需要人类来进行测试验证以及兜底。
AI时代的产品开发范式已经变了

传统的软件开发流程是这样的。
需求 → 设计 → 编码 → 测试 → 上线,根据Pressman教材数据,在经典软件工程里,测试环节通常占 20-30% 时间。
但是现在,编码环节被压缩到10-20%,但验证以及打磨环节占比飙升到50-70%。
JetBrains《2025开发者生态报告》显示:85%开发者定期用AI工具,62%依赖至少一个AI编码助手,但他们把更多时间花在“审查AI输出”和“调试AI生成代码”上(新增开销9-18%)。
我的看法是,如果多agent模式下的AI编码能力进一步提升,在一个项目团队里,产品和测试可能会比开发更为关键,毕竟编码的内容来自产品,编码的结果验证来源于测试。
在一个人一个团队的小型项目里,不会编码就能直接做应用的例子也逐渐习以为常,这一个人,大概率是更偏向于产品设计和测试。
市场的反馈其实也是这个趋势。
在中国市场,前程无忧《2026届校招AI人才需求报告》显示:AI测试工程师月薪中位数为13621元(虽低于核心算法岗的2.4-2.5万,但需求稳定增长,头部企业如阿里、腾讯、字节在AI质量方向扩招明显)。
这反映出:企业越来越愿意为“功能验证及质量控制”的能力买单。
为什么验证环节在AI时代变得更难、更重要?
第一个原因很容想到,那就是AI生成的代码充满概率性。
有数据称幻觉率(hallucination) 在复杂任务中可达 30-88%。
有时候AI觉得自己生成的东西没有问题,但真正上手测一下,就会发现一些隐藏的缺陷。
第二个原因是AI可以实现从“功能正确”, 但是“体验正确”却还需要反复的打磨。
AI很快做出“能跑”的东西,但“好用、防呆、边缘情况下不崩溃”的能力,还要靠人类来进行保证。
AI生成的代码往往停留在“表面能用”的层面:语法正确、逻辑基本通顺、基本路径走得通。但一到真实用户场景,就暴露出一堆“看起来小、实际致命”的体验问题。
这些坑AI自己很难感知,因为大模型缺乏真正的共情、上下文连续性和“好的人类体验”的直觉。
比如在我自己用 ai 实现的 kidcoins里,ai实现的兑奖下拉框原本是一个普通的select控件,用户体验不是很好。后面我自己上手之后给出了需要支持搜索的建议,反复修正之后,终于达到一个基本可用的用户体验。







