从 AI Coding 到 Agentic Engineering：研发提效正在进入第二阶段

在#AiDD 上海站的多场分论坛里，来自快手、去哪儿、阿里、思码逸、词元无限等公司的讲者，从不同角度触碰了同一个问题：AI Coding 的第一阶段，我们把工具给了每个人；AI Coding 的第二阶段，我们需要重构的是整个工程范式。

中智凯灵

304人浏览 · 2026-06-01 15:40:48

中智凯灵 · 2026-06-01 15:40:48 发布

——基于第9届 AI+研发数字峰会（AiDD 2026 上海站）的系列观察报道（3）

▼

▍上线越来越快，验证却越来越慢

当AI 代码生成率突破60%、上千名工程师全面铺开AI 工具，组织的交付速率却依然原地踏步——这个矛盾，成了2026 年工程界最难以回避的集体困惑。

快手主站AI DevOps 项目负责人李思，在第9 届AiDD 峰会上海站开场时就亮出了这组数据：快手主站1000 余名工程师全面推开AI 工具后，AI 代码生成率达到60%、AI 用例生成率达到60%、AI CR 生成率达到75%。然而，这些数据，到底给组织带来了什么实质性的变化？

他给出的答案，令人沉默：人均吞吐、交付速率，基本持平。

这不是快手一家的困境。在AiDD 上海站的多场分论坛里，来自快手、去哪儿、阿里、思码逸、词元无限等公司的讲者，从不同角度触碰了同一个问题：AI Coding 的第一阶段，我们把工具给了每个人；AI Coding 的第二阶段，我们需要重构的是整个工程范式。

▍用AI 工具不等于个人提效：工具普及之后的第一个清醒时刻

快手主站的数据提供了一个罕见的大规模观察样本。在超过1000 名工程师全面推开AI 工具后，李思的团队发现：个体效率差异，不在于有没有用AI 工具，而在于从AI 辅助到AI 协同再到AI 主导的范式代差。

AI辅助阶段，AI 在部分工作单元提供信息，人仍是核心控制者；AI 协同阶段，AI 完成初稿，人负责修改完善；AI 主导阶段，AI 自主完成需求交付，人提供资源和验收。这三个层次，对应的效率增益完全不同——快手的实测数据显示，L3 Agentic 模式的提效转化效率，是L2 协同模式的3 倍以上。

但更关键的洞察是：AI 越快，人和人之间的协作摩擦越明显。

快手团队发现，AI 代码生成率提升之后，Coding 时间缩短了，但等待测试的时间却在膨胀；AI 用例生成率提升之后，人工用例投入减少了，但整体周期没有变化。节省的时间去哪了？去填了原有协作流程的等待和对齐成本。

李思将这个现象概括为一个根源、两种摩擦：当AI 工具嵌入了以人为核心设计的协作体系，能力因的效率增益，会被结构因的损耗吸收。传统的专业分工、串行接力、提测约定、跨团队权限隔离，这些为人设计的协作机制，正在成为AI 提效的隐性天花板。

图1：李思《快手主站千人级团队AI 研发范式升级实践》：AI 工具全面铺开后的效能迷局——出码率60%、用例生成率60%、CR 生成率75%，组织交付速率却基本持平（PPT 第5 页）

图2：李思《快手主站千人级团队AI 研发范式升级实践》：效率断点分析——L3 Agentic 模式同时消除人-人与人-机协作摩擦，提效转化效率是L2 的3 倍以上（PPT 第15 页）

▍从Copilot 到Agent：快手的三年演进路线图

如果说李思的报告揭示了为什么工具普及还不够，那么快手AI Coding 专家周鸿轩的演讲，则勾画了这一跃迁的完整技术路线。

周鸿轩将快手从2023 年到2026 年的AI Coding 演进划分为四个阶段：2023 年10 月，代码补全与代码问答，核心问题是AI 能不能帮我写得更快，辅助提效，面向个人；2024 年3 月，Coding Agent 走向可用，核心问题变成Agent 能不能自己完成任务，个人提效；2025 年3 月，Agent Harness 突破本地架构限制，走向异步化运行；2026 年1 月，Agent Teams 深度融入团队协作，核心问题升级为团队能不能让Agent 稳定参与真实交付，组织提效。

这条演进线上，最关键的跃迁发生在第三和第四阶段之间。当Agent 从本地运行走向随时随地运行，AI 开始从增强个体，走向重构个体之间的协作关系。

周鸿轩给出了一个简洁的总结：AI 产品正在从增强个体使用者，走向重构使用者之间的协作关系——人与AI、人与人之间如何传递上下文、完成任务。在最新的架构设计中，Human 和Agent 作为成员，通过双入口操作同一套系统数据，沟通成本从反复同步变成围绕对象协作。

图3：周鸿轩《从Copilot 到Agent：开发提效与范式跃迁》：从代码补全到Agent Teams 的四阶段演进路线图（PPT 第6 页）

图4：周鸿轩《从Copilot 到Agent》：从增强个体到重构个体之间的协作关系（PPT 第22 页）

▍AI 原生软件工程的目标：不是干得快，而是自主可靠地持续交付

快手讲的是大规模组织的演进路径。思码逸CEO 任晶磊，则从工程哲学的角度，为Agentic Engineering 给出了一个更清晰的目标定义。

他在演讲开场抛出了一个反直觉的观点：快速构建原型不是AI Coding 的全部意义。

正确的目标应该是：Agent 自主可靠地持续交付有价值的工作——自主，意味着长时间无人干预，减少人的负担；可靠，意味着准确、稳定、鲁棒；持续，意味着长期可维护性；有价值，意味着以业务为导向。

这四个要求叠加在一起，就指向了AI 原生软件工程的基础：面向可靠性设计的多Agent 系统。

任晶磊的团队在思码逸内部已经实践了小时级Agent 无干预编程——Agent 在新旧项目上自主执行数小时，中途完全无人介入。这个实践背后，依赖于三个机制：多模型Agent 配合、基于状态机的可视化Skill，以及基于容器的sandbox 基础设施。

DevData 2026研发效能调研数据提供了行业佐证：2025 年需求交付周期中位值从15 天降至7 天。但与此同时，交付质量出现分化——半数企业的质量管控跟上了AI 节奏，另一半企业的问题密度正在上升。任晶磊指出：AI 收益的释放，高度依赖企业现有DevOps 基础设施的成熟度；CI 基础越扎实，AI 提效带来的增益越显著。

图5：任晶磊《小时级Agent 无干预编程实践与AI 原生软件开发范式》：AI 原生软件工程的目标——自主、可靠、持续、有价值（PPT 第9 页）

图6：任晶磊《小时级Agent 无干预编程实践》：DevData 2026 研效数据——需求交付周期中位值从15 天降至7 天（PPT 第25 页）

▍从单Agent 到专家团：AI Coding 进入团队作战时代

当Agent 能力从辅助走向自主，另一个工程问题浮出水面：单Agent 的上下文过载、长任务漂移、串行执行，正在成为新的瓶颈。

阿里巴巴QTeam 技术专家周成武，在题为《专家团（Experts）模式，将AI Coding 带入团队作战时代》的演讲中，系统拆解了单Agent 的七大痛点：上下文过载、Token 烧钱、长任务目标漂移、每次会话从零开始、角色混乱、串行执行效率低，以及盲目自信——代码能跑但功能是错的。

Qoder Experts专家团架构针对这些痛点给出了多智能体协同方案：由Leader Agent 负责任务分解与决策，调研专家、前端编码专家、后端编码专家、测试专家、代码评审专家等角色并行执行，异步通信，结果汇报给Leader。

这一架构带来三个核心价值：多专家分工并行协作，将单Agent 串行流程拆解为多角色并行推进；越用越强的AI 团队，通过任务经验持续沉淀与复用，协作效率随使用逐步提升；从生成代码到交付结果，工作范围从代码生成扩展至规划、测试与评审，目标是输出可合并的完整交付物。

周成武总结了AI Coding 的范式迁移曲线：2024 年以前，30% 依赖AI、提效10%；2024 到2025 年，80% 依赖AI、提效80%；2026 年起，100% 依赖AI、提效10 倍，AI 自主编程。AI 提升研发效能的本质，正在从单点效率走向协同效率。

图7：周成武《专家团（Experts）模式，将AI Coding 带入团队作战时代》：AI Coding 从辅助编程到协同编程到AI 自主编程的范式迁移曲线（PPT 第7 页）

图8：周成武《专家团（Experts）模式》：Qoder Experts 多智能体架构——Leader + 各专家角色并行执行，实现端到端软件交付（PPT 第14 页）

▍Skills 和平台：去哪儿给出的规模化落地路线

从理念到落地，去哪儿旅行的实践给出了一条可复制的工程化路径。

去哪儿旅行基础架构负责人、技术总监李佳奇，在题为《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》的演讲中，分享了从研发数字化到L3 AI Coding 落地的完整历程：数百人业务研发团队长期维持75% 以上出码率，实现L3 级别的AI Coding 落地。

他们将AI Coding 分为六个等级：L0 全手动，L1 代码辅助，L2 部分功能生成，L3 有条件自动化，L4 高度自动化，L5 完全自动化。从L2 到L3 的关键，是研发平台和Skills 的体系化建设。

去哪儿沉淀了三类核心Skills：一句话需求自动化开发Skills、自动调试和部署Skills、性能自动优化Skills。这些Skills 支撑了几类典型的L3 交付场景：JDK/Spring 等框架自动升级（研发周期从天级缩短到秒级）、业务线一句话需求规模化自动交付、生产环境必修异常自动修复。

李佳奇特别强调了数据体系建设的前提价值：规模化AI Coding 落地，首先需要出码率和自动化水平的准确测量。数据基座不仅是度量工具，更是AI 能力持续迭代的反馈飞轮。

图9：李佳奇《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》：AI 研发自动化水平L0-L5 等级模型定义（PPT 第10 页）

▍从结构重构到组织重塑：下一阶段的真正命题

综合以上几场报告，可以勾勒出从AI Coding 到Agentic Engineering 的完整演进图景。

第一阶段的提效，主要靠工具覆盖和个体提速：代码补全、用例生成、文档生成，本质是给已有流程打补丁。

第二阶段的提效，需要的是工程范式的升级：把Agent 编排进研发链路，让上下文贯通需求、开发、测试和部署，让人-人协作摩擦和人-机协作摩擦同步消除，让Skills 和经验沉淀为可复用的组织资产。

快手的数据给出了具体的量化参照：L2 规模化演进阶段，大盘L2 交付需求占比超过60%，交付周期较L1 缩短20%-30%；L3 局部场景突破阶段，先锋团队交付周期缩短60%-90%，单需求平均研发人数下降58%。

李思在演讲末尾留下了一段颇具人文色彩的提问：AI 跳过了慢慢写的过程，但直觉和敬畏从哪里长出来？我们的组织，有没有给年轻人留出慢慢生长的机会？

AI不是取代。Agentic Engineering 的目标，是让人的洞察、远见和温度，得到更充分的发挥。这，也许才是第二阶段真正值得努力的方向。

🔖 主要参考演讲

·李思：《快手主站千人级团队AI 研发范式升级实践》，快手专场：AI x 研发效能论坛@第9届AiDD，2026-05-23。

·周鸿轩：《从Copilot 到Agent：开发提效与范式跃迁》，快手专场：AI x 研发效能论坛@第9届AiDD，2026-05-23。

·任晶磊：《小时级Agent 无干预编程实践与AI 原生软件开发范式》，AI+研发效能10X提升论坛@第9届AiDD，2026-05-22。

·李佳奇：《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》，原生IDE和开发工具论坛@第9届AiDD，2026-05-23。

·周成武：《专家团（Experts）模式，将AI Coding 带入团队作战时代》，原生IDE和开发工具论坛@第9届AiDD，2026-05-23。

·第9届 AI+研发数字峰会（AiDD 2026 上海站）的系列观察报道（2）：从跑分到护栏：AI Agent 规模化落地，为什么必须先补上质量底座？

·硬核对话：从1000人到1人：AI编程的"规模化陷阱"如何破？

·第9届AI+研发数字峰会（AiDD）上海站圆满收官！

这么好的内容，你不转一下吗

转发本篇文章至朋友圈，截图私信后台可免费领取AiDD上海站演讲PPT下载链接！

下一站

Agentic Engineering 的故事，上海站只是开篇。AI Coding 的范式跃迁、Agent 的组织化落地、Skills 体系的工程化沉淀——这些议题，在 AiDD 上海站刚刚打开了话题。即将到来的8月21-22日AiDD北京站，将在上海的基础上继续深挖：AI+开发、AI+工程、AI+组织与流程，还有更多企业的一线实践，等待登台分享。从 Copilot 到 Agentic Engineering，从工具提效到范式重构，这场变革远没有结束。