摘要: 我用 AI IDE(Cursor / Windsurf / JetBrains AI Assistant)连续编程 90 天,写了 2.3 w 行代码,交付 5 个项目。AI 到底是「提效 47%」的神器,还是「内卷加剧」的元凶?读完你会得到:一份可直接套用的「AI 编程防坑 checklist」、一条「不加班」的落地路径,以及一张「人类程序员不可替代技能地图」。

目录

  1. 缘起:为什么我要连续 90 天把键盘交给 AI?

  2. 实测环境 & 打分规则(让数据先说话)

  3. 90 天日记:效率、质量、情绪三条曲线

  4. 收益量化:提效 47%,但加班时长反增 12%?

  5. 风险与副作用:AI 编程的 4 把「暗刃」

  6. 防坑指南:从「Prompt 模板」到「Code Review 红线」

  7. 未来已来:程序员的不可替代技能地图(附脑图)

  8. 结论:AI 不能让你直接告别 996,但它给了你选择的权利

1. 缘起:为什么我要连续 90 天把键盘交给 AI?

2024 年底,公司裁掉 30% 测试、10% 后端,需求却只增不减。领导拍脑袋:“大家不是都在用 AI 吗?提效 30% 应该没问题吧?”
于是,我立下 flag:用 AI IDE 完成接下来 90 天的全部任务,并记录每一小时的心率、产出、Bug 率。为了控制变量,我选了 3 台同等配置 MacBook,分别装上 Cursor、Windsurf、IntelliJ AI Assistant。

2. 实测环境 & 打分规则

维度 权重 评分标准
功能正确性 30% 单元测试通过率=100% 得满分
可读性 20% Code Review 平均分
交付效率 25% story point / 人时
情绪指数 15% 每晚 22:00 自评 1~5
加班时长 10% git commit time 分布

数据来源:git log、Jira、Apple Watch 心率、Notion 日记。

3. 90 天日记:三条曲线揭示真相

3.1 效率曲线(story point / 人时)
  • 第 1~10 天:+12%(新鲜期,AI 生成 80% 样板代码)

  • 第 11~40 天:+47%(磨合完成,Prompt 模板化,形成「AI 代码库」)

  • 第 41~70 天:+32%(边际效应递减,复杂业务仍需人工重构)

  • 第 71~90 天:+28%(团队规范介入,强制 Code Review)

3.2 质量曲线(Bug 密度 / 千行)

Week1 0.9 → Week4 0.4 → Week8 0.6 → Week12 0.7

AI 生成的「边界条件」代码是重灾区,第 8 周后回弹明显。

3.3 情绪曲线(1~5 主观打分)
  • 第 1 周:4.5(太爽了,Tab 一下世界清净)

  • 第 5 周:3.8(开始焦虑:AI 写得比我快,我会不会被干掉?)

  • 第 9 周:4.2(学会“让 AI 写 80%,我修 20%”后重新掌控节奏)

4. 收益量化:提效 47%,但加班时长反增 12%?

指标 AI 组 基线组(去年同期) 变化
平均 story point / 人天 21.7 14.8 +46.6%
平均加班时长 / 周 10.3h 9.2h +12.0%
上线故障 P1+P2 2 5 -60%

为什么效率提升,却更卷了?
根因:需求被重新估算。 产品经理发现「开发估时」变短,直接把下个版本的 Scope 拉大了 40%。于是,AI 创造的剩余价值,被业务方“吞噬”了。

结论:如果组织文化不改,AI 只是更高效的「996 发动机」。

5. AI 编程的 4 把「暗刃」

风险 场景示例 我的踩坑记录
幻觉代码 生成不存在的 API 第 17 天调用 LocalDateTime.toEpochMilli()(JDK 没有)
安全漏洞 AI 喜欢硬编码密钥 Cursor 曾在注释里塞了 OpenAI 的 sk-xxx
版权雷区 训练集污染 GPL 第 38 天 Windsurf 直接吐出 120 行 GPL 代码
思维退化 不再写算法题 第 50 天做面试手撕 LRU 直接卡壳 20 分钟

6. 防坑指南:一键复用的 Prompt 模板 & Review checklist

6.1 Prompt 模板
背景:Spring Boot 3.2 + JDK21  
任务:写一个幂等消费 Kafka 消息的 Service  
要求:  
- 使用 @Retryable + @IdempotentKey  
- 单元测试覆盖率 >80%  
- 不要引入 GPL 组件  
- 所有异常都自定义 BizException  

把「背景+任务+要求」放在 System Prompt,AI 生成的代码一次性通过率从 66% → 91%。

6.2 Code Review 红线(团队落地版)
  • Step1:AI 生成的代码必须通过 SonarQube「 blocker 0 个」

  • Step2:关键路径(支付、登录、权限)必须人工补 UT

  • Step3:敏感词扫描(密钥、内网 IP、身份证正则)

  • Step4:每周随机 5% AI 代码做「人工重写」,防止思维退化

7. 未来已来:程序员不可替代技能地图

我把 90 天里「AI 搞不定/经常翻车」的任务画成一张脑图(高清 PDF 文末自取)。核心 3 句话:

  1. 越靠近业务本质、越难被 AI 替代:需求澄清、领域建模、跨团队推拉。

  2. 越靠近用户体验、越难被 AI 替代:性能调优最后一英里、异常现场定位、用户情绪洞察。

  3. 越靠近创新、越难被 AI 替代:0→1 的技术方案、技术布道、团队教练。


8. 结论:AI 不能让你直接告别 996,但它给了你选择的权利

这 90 天我最大的感受是:

  • 把 AI 当「实习生」:效率↑,加班↓,心情好。

  • 把 AI 当「替代品」:需求↑,Bug↑,焦虑↑。

所以,AI 本身不是 996 的终结者,组织如何使用 AI、个人如何定位自己,才是决定你能否早下班的关键。

附送一句话:

“AI 不会让你失业,但会用 AI 的人会让不会用 AI 的人失业。”——现在把这句话反过来读一遍,就是答案。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐