——基于第9届 AI+研发数字峰会(AiDD 2026 上海站)的系列观察报道(3)

▍上线越来越快,验证却越来越慢

AI 代码生成率突破60%、上千名工程师全面铺开AI 工具,组织的交付速率却依然原地踏步——这个矛盾,成了2026 年工程界最难以回避的集体困惑。

快手主站AI DevOps 项目负责人李思,在第AiDD 峰会上海站开场时就亮出了这组数据:快手主站1000 余名工程师全面推开AI 工具后,AI 代码生成率达到60%AI 用例生成率达到60%AI CR 生成率达到75%。然而,这些数据,到底给组织带来了什么实质性的变化?

他给出的答案,令人沉默:人均吞吐、交付速率,基本持平。

这不是快手一家的困境。在AiDD 上海站的多场分论坛里,来自快手、去哪儿、阿里、思码逸、词元无限等公司的讲者,从不同角度触碰了同一个问题:AI Coding 的第一阶段,我们把工具给了每个人;AI Coding 的第二阶段,我们需要重构的是整个工程范式。

▍用AI 工具不等于个人提效:工具普及之后的第一个清醒时刻

快手主站的数据提供了一个罕见的大规模观察样本。在超过1000 名工程师全面推开AI 工具后,李思的团队发现:个体效率差异,不在于有没有用AI 工具,而在于从AI 辅助到AI 协同再到AI 主导的范式代差。

AI辅助阶段,AI 在部分工作单元提供信息,人仍是核心控制者;AI 协同阶段,AI 完成初稿,人负责修改完善;AI 主导阶段,AI 自主完成需求交付,人提供资源和验收。这三个层次,对应的效率增益完全不同——快手的实测数据显示,L3 Agentic 模式的提效转化效率,是L2 协同模式的倍以上。

但更关键的洞察是:AI 越快,人和人之间的协作摩擦越明显。

快手团队发现,AI 代码生成率提升之后,Coding 时间缩短了,但等待测试的时间却在膨胀;AI 用例生成率提升之后,人工用例投入减少了,但整体周期没有变化。节省的时间去哪了?去填了原有协作流程的等待和对齐成本。

李思将这个现象概括为一个根源、两种摩擦:当AI 工具嵌入了以人为核心设计的协作体系,能力因的效率增益,会被结构因的损耗吸收。传统的专业分工、串行接力、提测约定、跨团队权限隔离,这些为人设计的协作机制,正在成为AI 提效的隐性天花板。

1:李思《快手主站千人级团队AI 研发范式升级实践》:AI 工具全面铺开后的效能迷局——出码率60%、用例生成率60%CR 生成率75%,组织交付速率却基本持平(PPT 页)

2:李思《快手主站千人级团队AI 研发范式升级实践》:效率断点分析——L3 Agentic 模式同时消除人-人与人-机协作摩擦,提效转化效率是L2 倍以上(PPT 15 页)

▍从Copilot 到Agent:快手的三年演进路线图

如果说李思的报告揭示了为什么工具普及还不够,那么快手AI Coding 专家周鸿轩的演讲,则勾画了这一跃迁的完整技术路线。

周鸿轩将快手从2023 年到2026 年的AI Coding 演进划分为四个阶段:2023 年10 月,代码补全与代码问答,核心问题是AI 能不能帮我写得更快,辅助提效,面向个人;2024 年3 月,Coding Agent 走向可用,核心问题变成Agent 能不能自己完成任务,个人提效;2025 年3 月,Agent Harness 突破本地架构限制,走向异步化运行;2026 年1 月,Agent Teams 深度融入团队协作,核心问题升级为团队能不能让Agent 稳定参与真实交付,组织提效。

这条演进线上,最关键的跃迁发生在第三和第四阶段之间。当Agent 从本地运行走向随时随地运行,AI 开始从增强个体,走向重构个体之间的协作关系。

周鸿轩给出了一个简洁的总结:AI 产品正在从增强个体使用者,走向重构使用者之间的协作关系——人与AI、人与人之间如何传递上下文、完成任务。在最新的架构设计中,Human 和Agent 作为成员,通过双入口操作同一套系统数据,沟通成本从反复同步变成围绕对象协作。

3:周鸿轩《从Copilot Agent:开发提效与范式跃迁》:从代码补全到Agent Teams 的四阶段演进路线图(PPT 页)

4:周鸿轩《从Copilot Agent》:从增强个体到重构个体之间的协作关系(PPT 22 页)

▍AI 原生软件工程的目标:不是干得快,而是自主可靠地持续交付

快手讲的是大规模组织的演进路径。思码逸CEO 任晶磊,则从工程哲学的角度,为Agentic Engineering 给出了一个更清晰的目标定义。

他在演讲开场抛出了一个反直觉的观点:快速构建原型不是AI Coding 的全部意义。

正确的目标应该是:Agent 自主可靠地持续交付有价值的工作——自主,意味着长时间无人干预,减少人的负担;可靠,意味着准确、稳定、鲁棒;持续,意味着长期可维护性;有价值,意味着以业务为导向。

这四个要求叠加在一起,就指向了AI 原生软件工程的基础:面向可靠性设计的多Agent 系统。

任晶磊的团队在思码逸内部已经实践了小时级Agent 无干预编程——Agent 在新旧项目上自主执行数小时,中途完全无人介入。这个实践背后,依赖于三个机制:多模型Agent 配合、基于状态机的可视化Skill,以及基于容器的sandbox 基础设施。

DevData 2026研发效能调研数据提供了行业佐证:2025 年需求交付周期中位值从15 天降至7 天。但与此同时,交付质量出现分化——半数企业的质量管控跟上了AI 节奏,另一半企业的问题密度正在上升。任晶磊指出:AI 收益的释放,高度依赖企业现有DevOps 基础设施的成熟度;CI 基础越扎实,AI 提效带来的增益越显著。

5:任晶磊《小时级Agent 无干预编程实践与AI 原生软件开发范式》:AI 原生软件工程的目标——自主、可靠、持续、有价值(PPT 页)

6:任晶磊《小时级Agent 无干预编程实践》:DevData 2026 研效数据——需求交付周期中位值从15 天降至天(PPT 25 页)

▍从单Agent 到专家团:AI Coding 进入团队作战时代

当Agent 能力从辅助走向自主,另一个工程问题浮出水面:单Agent 的上下文过载、长任务漂移、串行执行,正在成为新的瓶颈。

阿里巴巴QTeam 技术专家周成武,在题为《专家团(Experts)模式,将AI Coding 带入团队作战时代》的演讲中,系统拆解了单Agent 的七大痛点:上下文过载、Token 烧钱、长任务目标漂移、每次会话从零开始、角色混乱、串行执行效率低,以及盲目自信——代码能跑但功能是错的。

Qoder Experts专家团架构针对这些痛点给出了多智能体协同方案:由Leader Agent 负责任务分解与决策,调研专家、前端编码专家、后端编码专家、测试专家、代码评审专家等角色并行执行,异步通信,结果汇报给Leader。

这一架构带来三个核心价值:多专家分工并行协作,将单Agent 串行流程拆解为多角色并行推进;越用越强的AI 团队,通过任务经验持续沉淀与复用,协作效率随使用逐步提升;从生成代码到交付结果,工作范围从代码生成扩展至规划、测试与评审,目标是输出可合并的完整交付物。

周成武总结了AI Coding 的范式迁移曲线:2024 年以前,30% 依赖AI、提效10%;2024 到2025 年,80% 依赖AI、提效80%;2026 年起,100% 依赖AI、提效10 倍,AI 自主编程。AI 提升研发效能的本质,正在从单点效率走向协同效率。

7:周成武《专家团(Experts)模式,将AI Coding 带入团队作战时代》:AI Coding 从辅助编程到协同编程到AI 自主编程的范式迁移曲线(PPT 页)

8:周成武《专家团(Experts)模式》:Qoder Experts 多智能体架构——Leader + 各专家角色并行执行,实现端到端软件交付(PPT 14 页)

▍Skills 和平台:去哪儿给出的规模化落地路线

从理念到落地,去哪儿旅行的实践给出了一条可复制的工程化路径。

去哪儿旅行基础架构负责人、技术总监李佳奇,在题为《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》的演讲中,分享了从研发数字化到L3 AI Coding 落地的完整历程:数百人业务研发团队长期维持75% 以上出码率,实现L3 级别的AI Coding 落地。

他们将AI Coding 分为六个等级:L0 全手动,L1 代码辅助,L2 部分功能生成,L3 有条件自动化,L4 高度自动化,L5 完全自动化。从L2 到L3 的关键,是研发平台和Skills 的体系化建设。

去哪儿沉淀了三类核心Skills:一句话需求自动化开发Skills、自动调试和部署Skills、性能自动优化Skills。这些Skills 支撑了几类典型的L3 交付场景:JDK/Spring 等框架自动升级(研发周期从天级缩短到秒级)、业务线一句话需求规模化自动交付、生产环境必修异常自动修复。

李佳奇特别强调了数据体系建设的前提价值:规模化AI Coding 落地,首先需要出码率和自动化水平的准确测量。数据基座不仅是度量工具,更是AI 能力持续迭代的反馈飞轮。

9:李佳奇《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》:AI 研发自动化水平L0-L5 等级模型定义(PPT 10 页)

▍从结构重构到组织重塑:下一阶段的真正命题

综合以上几场报告,可以勾勒出从AI Coding 到Agentic Engineering 的完整演进图景。

第一阶段的提效,主要靠工具覆盖和个体提速:代码补全、用例生成、文档生成,本质是给已有流程打补丁。

第二阶段的提效,需要的是工程范式的升级:把Agent 编排进研发链路,让上下文贯通需求、开发、测试和部署,让人-人协作摩擦和人-机协作摩擦同步消除,让Skills 和经验沉淀为可复用的组织资产。

快手的数据给出了具体的量化参照:L2 规模化演进阶段,大盘L2 交付需求占比超过60%,交付周期较L1 缩短20%-30%;L3 局部场景突破阶段,先锋团队交付周期缩短60%-90%,单需求平均研发人数下降58%。

李思在演讲末尾留下了一段颇具人文色彩的提问:AI 跳过了慢慢写的过程,但直觉和敬畏从哪里长出来?我们的组织,有没有给年轻人留出慢慢生长的机会?

AI不是取代。Agentic Engineering 的目标,是让人的洞察、远见和温度,得到更充分的发挥。这,也许才是第二阶段真正值得努力的方向。

🔖 主要参考演讲

·李思:《快手主站千人级团队AI 研发范式升级实践》,快手专场:AI x 研发效能 论坛@第9届AiDD,2026-05-23。

·周鸿轩:《从Copilot 到Agent:开发提效与范式跃迁》,快手专场:AI x 研发效能 论坛@第9届AiDD,2026-05-23。

·任晶磊:《小时级Agent 无干预编程实践与AI 原生软件开发范式》,AI+研发效能10X提升 论坛@第9届AiDD,2026-05-22。

·李佳奇:《去哪儿旅行L3 AI Coding 的研发平台与Skills 实践》,原生IDE和开发工具 论坛@第9届AiDD,2026-05-23。

·周成武:《专家团(Experts)模式,将AI Coding 带入团队作战时代》,原生IDE和开发工具 论坛@第9届AiDD,2026-05-23。

🔖 相关文章

·第9届 AI+研发数字峰会(AiDD 2026 上海站)的系列观察报道(1):AI赋能研发组织提效的效果度量:从“个人效率”走向“组织交付”的新标尺

·第9届 AI+研发数字峰会(AiDD 2026 上海站)的系列观察报道(2):从跑分到护栏:AI Agent 规模化落地,为什么必须先补上质量底座?

·硬核对话:从1000人到1人:AI编程的"规模化陷阱"如何破?

·第9届AI+研发数字峰会(AiDD)上海站圆满收官!

这么好的内容,你不转一下吗

转发本篇文章至朋友圈,截图私信后台可免费领取AiDD上海站演讲PPT下载链接!

下一站

Agentic Engineering 的故事,上海站只是开篇。AI Coding 的范式跃迁、Agent 的组织化落地、Skills 体系的工程化沉淀——这些议题,在 AiDD 上海站刚刚打开了话题。即将到来的8月21-22日AiDD北京站,将在上海的基础上继续深挖:AI+开发、AI+工程、AI+组织与流程,还有更多企业的一线实践,等待登台分享。从 Copilot 到 Agentic Engineering,从工具提效到范式重构,这场变革远没有结束。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐