AI IDE+AI 辅助编程，真能让程序员告别 996？——90 天深度实测：从「摸鱼神器」到「双刃剑」的完整复盘

作者以 90 天连续真机实测，用 Cursor / Windsurf / JetBrains AI Assistant 写完 2.3 w 行代码、交付 5 个项目，结果显示：开发效率提升 47%，但需求膨胀让加班反增 12%；AI 生成的边界 Bug、幻觉代码、GPL 污染、思维退化是四大暗刃。文章给出可一键复制的 Prompt 模板与 4 步 Code Review 红线。结论：AI 不是 99

m0_75076438

591人浏览 · 2025-08-11 10:42:47

m0_75076438 · 2025-08-11 10:42:47 发布

摘要：我用 AI IDE（Cursor / Windsurf / JetBrains AI Assistant）连续编程 90 天，写了 2.3 w 行代码，交付 5 个项目。AI 到底是「提效 47%」的神器，还是「内卷加剧」的元凶？读完你会得到：一份可直接套用的「AI 编程防坑 checklist」、一条「不加班」的落地路径，以及一张「人类程序员不可替代技能地图」。

缘起：为什么我要连续 90 天把键盘交给 AI？
实测环境 & 打分规则（让数据先说话）
90 天日记：效率、质量、情绪三条曲线
收益量化：提效 47%，但加班时长反增 12%？
风险与副作用：AI 编程的 4 把「暗刃」
防坑指南：从「Prompt 模板」到「Code Review 红线」
未来已来：程序员的不可替代技能地图（附脑图）
结论：AI 不能让你直接告别 996，但它给了你选择的权利

1. 缘起：为什么我要连续 90 天把键盘交给 AI？

2024 年底，公司裁掉 30% 测试、10% 后端，需求却只增不减。领导拍脑袋：“大家不是都在用 AI 吗？提效 30% 应该没问题吧？”
于是，我立下 flag：用 AI IDE 完成接下来 90 天的全部任务，并记录每一小时的心率、产出、Bug 率。为了控制变量，我选了 3 台同等配置 MacBook，分别装上 Cursor、Windsurf、IntelliJ AI Assistant。

2. 实测环境 & 打分规则

维度	权重	评分标准
功能正确性	30%	单元测试通过率=100% 得满分
可读性	20%	Code Review 平均分
交付效率	25%	story point / 人时
情绪指数	15%	每晚 22:00 自评 1~5
加班时长	10%	git commit time 分布

数据来源：git log、Jira、Apple Watch 心率、Notion 日记。

3. 90 天日记：三条曲线揭示真相

3.1 效率曲线（story point / 人时）

第 1~10 天：+12%（新鲜期，AI 生成 80% 样板代码）
第 11~40 天：+47%（磨合完成，Prompt 模板化，形成「AI 代码库」）
第 41~70 天：+32%（边际效应递减，复杂业务仍需人工重构）
第 71~90 天：+28%（团队规范介入，强制 Code Review）

3.2 质量曲线（Bug 密度 / 千行）

Week1 0.9 → Week4 0.4 → Week8 0.6 → Week12 0.7

AI 生成的「边界条件」代码是重灾区，第 8 周后回弹明显。

3.3 情绪曲线（1~5 主观打分）

第 1 周：4.5（太爽了，Tab 一下世界清净）
第 5 周：3.8（开始焦虑：AI 写得比我快，我会不会被干掉？）
第 9 周：4.2（学会“让 AI 写 80%，我修 20%”后重新掌控节奏）

4. 收益量化：提效 47%，但加班时长反增 12%？

指标	AI 组	基线组（去年同期）	变化
平均 story point / 人天	21.7	14.8	+46.6%
平均加班时长 / 周	10.3h	9.2h	+12.0%
上线故障 P1+P2	2	5	-60%

为什么效率提升，却更卷了？
根因：需求被重新估算。 产品经理发现「开发估时」变短，直接把下个版本的 Scope 拉大了 40%。于是，AI 创造的剩余价值，被业务方“吞噬”了。

结论：如果组织文化不改，AI 只是更高效的「996 发动机」。

5. AI 编程的 4 把「暗刃」

风险	场景示例	我的踩坑记录
幻觉代码	生成不存在的 API	第 17 天调用 `LocalDateTime.toEpochMilli()`（JDK 没有）
安全漏洞	AI 喜欢硬编码密钥	Cursor 曾在注释里塞了 OpenAI 的 sk-xxx
版权雷区	训练集污染 GPL	第 38 天 Windsurf 直接吐出 120 行 GPL 代码
思维退化	不再写算法题	第 50 天做面试手撕 LRU 直接卡壳 20 分钟

6. 防坑指南：一键复用的 Prompt 模板 & Review checklist

6.1 Prompt 模板

背景：Spring Boot 3.2 + JDK21  
任务：写一个幂等消费 Kafka 消息的 Service  
要求：  
- 使用 @Retryable + @IdempotentKey  
- 单元测试覆盖率 >80%  
- 不要引入 GPL 组件  
- 所有异常都自定义 BizException

把「背景+任务+要求」放在 System Prompt，AI 生成的代码一次性通过率从 66% → 91%。

6.2 Code Review 红线（团队落地版）

Step1：AI 生成的代码必须通过 SonarQube「 blocker 0 个」
Step2：关键路径（支付、登录、权限）必须人工补 UT
Step3：敏感词扫描（密钥、内网 IP、身份证正则）
Step4：每周随机 5% AI 代码做「人工重写」，防止思维退化

7. 未来已来：程序员不可替代技能地图

我把 90 天里「AI 搞不定/经常翻车」的任务画成一张脑图（高清 PDF 文末自取）。核心 3 句话：

越靠近业务本质、越难被 AI 替代：需求澄清、领域建模、跨团队推拉。
越靠近用户体验、越难被 AI 替代：性能调优最后一英里、异常现场定位、用户情绪洞察。
越靠近创新、越难被 AI 替代：0→1 的技术方案、技术布道、团队教练。

8. 结论：AI 不能让你直接告别 996，但它给了你选择的权利

这 90 天我最大的感受是：

把 AI 当「实习生」：效率↑，加班↓，心情好。
把 AI 当「替代品」：需求↑，Bug↑，焦虑↑。

所以，AI 本身不是 996 的终结者，组织如何使用 AI、个人如何定位自己，才是决定你能否早下班的关键。

附送一句话：

“AI 不会让你失业，但会用 AI 的人会让不会用 AI 的人失业。”——现在把这句话反过来读一遍，就是答案。

AI编程社区

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

AI赋能全栈项目管理：从需求到上线的全流程实战

AI编程社区

MongoDB发布一系列产品创新和拓展合作伙伴生态系统夯实AI应用基础

该服务器不仅通过标准化方式，使得开发者能够将MongoDB部署直接连接到多款热门工具（如Visual Studio Code中的GitHub CoPilot、Anthropic的Claude、Cursor和Windsurf），从而使他们能够使用自然语言与数据进行交互以及管理数据库操作，而且还简化了基于AI的MongoDB应用程序的开发工作，进而加速工作流程，提升生产力，并缩短产品上市时间。携手合作