AI IDE+AI 辅助编程,真能让程序员告别 996?——90 天深度实测:从「摸鱼神器」到「双刃剑」的完整复盘
作者以 90 天连续真机实测,用 Cursor / Windsurf / JetBrains AI Assistant 写完 2.3 w 行代码、交付 5 个项目,结果显示:开发效率提升 47%,但需求膨胀让加班反增 12%;AI 生成的边界 Bug、幻觉代码、GPL 污染、思维退化是四大暗刃。文章给出可一键复制的 Prompt 模板与 4 步 Code Review 红线。结论:AI 不是 99
摘要: 我用 AI IDE(Cursor / Windsurf / JetBrains AI Assistant)连续编程 90 天,写了 2.3 w 行代码,交付 5 个项目。AI 到底是「提效 47%」的神器,还是「内卷加剧」的元凶?读完你会得到:一份可直接套用的「AI 编程防坑 checklist」、一条「不加班」的落地路径,以及一张「人类程序员不可替代技能地图」。
目录
-
缘起:为什么我要连续 90 天把键盘交给 AI?
-
实测环境 & 打分规则(让数据先说话)
-
90 天日记:效率、质量、情绪三条曲线
-
收益量化:提效 47%,但加班时长反增 12%?
-
风险与副作用:AI 编程的 4 把「暗刃」
-
防坑指南:从「Prompt 模板」到「Code Review 红线」
-
未来已来:程序员的不可替代技能地图(附脑图)
-
结论:AI 不能让你直接告别 996,但它给了你选择的权利
1. 缘起:为什么我要连续 90 天把键盘交给 AI?
2024 年底,公司裁掉 30% 测试、10% 后端,需求却只增不减。领导拍脑袋:“大家不是都在用 AI 吗?提效 30% 应该没问题吧?”
于是,我立下 flag:用 AI IDE 完成接下来 90 天的全部任务,并记录每一小时的心率、产出、Bug 率。为了控制变量,我选了 3 台同等配置 MacBook,分别装上 Cursor、Windsurf、IntelliJ AI Assistant。
2. 实测环境 & 打分规则
维度 | 权重 | 评分标准 |
---|---|---|
功能正确性 | 30% | 单元测试通过率=100% 得满分 |
可读性 | 20% | Code Review 平均分 |
交付效率 | 25% | story point / 人时 |
情绪指数 | 15% | 每晚 22:00 自评 1~5 |
加班时长 | 10% | git commit time 分布 |
数据来源:git log、Jira、Apple Watch 心率、Notion 日记。
3. 90 天日记:三条曲线揭示真相
3.1 效率曲线(story point / 人时)
-
第 1~10 天:+12%(新鲜期,AI 生成 80% 样板代码)
-
第 11~40 天:+47%(磨合完成,Prompt 模板化,形成「AI 代码库」)
-
第 41~70 天:+32%(边际效应递减,复杂业务仍需人工重构)
-
第 71~90 天:+28%(团队规范介入,强制 Code Review)
3.2 质量曲线(Bug 密度 / 千行)
Week1 0.9 → Week4 0.4 → Week8 0.6 → Week12 0.7
AI 生成的「边界条件」代码是重灾区,第 8 周后回弹明显。
3.3 情绪曲线(1~5 主观打分)
-
第 1 周:4.5(太爽了,Tab 一下世界清净)
-
第 5 周:3.8(开始焦虑:AI 写得比我快,我会不会被干掉?)
-
第 9 周:4.2(学会“让 AI 写 80%,我修 20%”后重新掌控节奏)
4. 收益量化:提效 47%,但加班时长反增 12%?
指标 | AI 组 | 基线组(去年同期) | 变化 |
---|---|---|---|
平均 story point / 人天 | 21.7 | 14.8 | +46.6% |
平均加班时长 / 周 | 10.3h | 9.2h | +12.0% |
上线故障 P1+P2 | 2 | 5 | -60% |
为什么效率提升,却更卷了?
根因:需求被重新估算。 产品经理发现「开发估时」变短,直接把下个版本的 Scope 拉大了 40%。于是,AI 创造的剩余价值,被业务方“吞噬”了。
结论:如果组织文化不改,AI 只是更高效的「996 发动机」。
5. AI 编程的 4 把「暗刃」
风险 | 场景示例 | 我的踩坑记录 |
---|---|---|
幻觉代码 | 生成不存在的 API | 第 17 天调用 LocalDateTime.toEpochMilli() (JDK 没有) |
安全漏洞 | AI 喜欢硬编码密钥 | Cursor 曾在注释里塞了 OpenAI 的 sk-xxx |
版权雷区 | 训练集污染 GPL | 第 38 天 Windsurf 直接吐出 120 行 GPL 代码 |
思维退化 | 不再写算法题 | 第 50 天做面试手撕 LRU 直接卡壳 20 分钟 |
6. 防坑指南:一键复用的 Prompt 模板 & Review checklist
6.1 Prompt 模板
背景:Spring Boot 3.2 + JDK21
任务:写一个幂等消费 Kafka 消息的 Service
要求:
- 使用 @Retryable + @IdempotentKey
- 单元测试覆盖率 >80%
- 不要引入 GPL 组件
- 所有异常都自定义 BizException
把「背景+任务+要求」放在 System Prompt,AI 生成的代码一次性通过率从 66% → 91%。
6.2 Code Review 红线(团队落地版)
-
Step1:AI 生成的代码必须通过 SonarQube「 blocker 0 个」
-
Step2:关键路径(支付、登录、权限)必须人工补 UT
-
Step3:敏感词扫描(密钥、内网 IP、身份证正则)
-
Step4:每周随机 5% AI 代码做「人工重写」,防止思维退化
7. 未来已来:程序员不可替代技能地图
我把 90 天里「AI 搞不定/经常翻车」的任务画成一张脑图(高清 PDF 文末自取)。核心 3 句话:
-
越靠近业务本质、越难被 AI 替代:需求澄清、领域建模、跨团队推拉。
-
越靠近用户体验、越难被 AI 替代:性能调优最后一英里、异常现场定位、用户情绪洞察。
-
越靠近创新、越难被 AI 替代:0→1 的技术方案、技术布道、团队教练。
8. 结论:AI 不能让你直接告别 996,但它给了你选择的权利
这 90 天我最大的感受是:
-
把 AI 当「实习生」:效率↑,加班↓,心情好。
-
把 AI 当「替代品」:需求↑,Bug↑,焦虑↑。
所以,AI 本身不是 996 的终结者,组织如何使用 AI、个人如何定位自己,才是决定你能否早下班的关键。
附送一句话:
“AI 不会让你失业,但会用 AI 的人会让不会用 AI 的人失业。”——现在把这句话反过来读一遍,就是答案。
更多推荐
所有评论(0)