这份第九版报告核心聚焦AI 技术发展速度远超治理、评估、教育等配套系统适应能力的核心矛盾,从研发、技术、责任、经济、应用等九大维度全景呈现 2025-2026 年全球 AI 发展态势,关键结论如下:

一、研发与技术:能力爆发,格局收敛

模型能力突破人类基准

前沿模型在博士级科学问题、多模态推理、竞赛数学上超越人类,编码基准 SWE-bench 性能逼近 100% 人类水平,Gemini Deep Think 拿下国际数学奥林匹克金牌;但存在锯齿状能力缺陷,顶级模型读模拟时钟正确率仅 50.1%。

产业主导研发,透明度下降

行业产出超 90% 前沿模型,OpenAI、谷歌、阿里巴巴是核心玩家;但头部模型隐瞒参数、训练数据、代码,透明度大幅降低。

中美竞争趋同,供应链高度集中

美国领跑模型研发与高价值专利,中国在论文、专利总量、工业机器人占优,两国顶尖模型性能差距仅 2.7%;全球 AI 芯片几乎由台积电独家生产,供应链极度脆弱。

技术性能趋同,开源重新掉队

头部模型性能差距缩至 25 个 Elo 分以内,竞争转向成本、可靠性;闭源模型重新领先开源模型 3.3%,中美模型性能差距几乎抹平。

代理与自动驾驶进步显著,机器人仍落后

AI 代理完成计算机任务成功率从 12% 升至 66%,自动驾驶实现大规模落地(Waymo 周均 45 万行程);但家用机器人任务成功率仅 12%,物理世界能力差距巨大。

二、核心痛点:能力狂奔,配套全面滞后

评估体系失效

传统基准快速饱和,部分基准无效问题率高达 42%,难以衡量真实能力。

负责任 AI 进展缓慢

记录 AI 安全事件增至 362 起,头部模型极少公开责任 AI 测评结果;模型幻觉率 22%-94%,难以区分事实与信念,安全防御易被对抗攻击突破。

治理碎片化

各国政策方向分裂(欧盟严监管、美国放松),AI 主权成核心原则,发展中国家首次大规模出台 AI 战略;全球对 AI 监管信任度分化,欧盟认可度最高。

人才与教育失衡

美国 AI 人才吸引力暴跌(十年流入降 89%),AI 人才性别差距无改善;超 80% 学生使用生成式 AI,但仅 6% 学校有明确 AI 政策。

三、经济与社会:普及加速,影响分化

adoption 速度史上最快

生成式 AI3 年普及率达 53%,超 PC 与互联网,企业采纳率 88%,预计年消费价值 1720 亿美元。

就业与生产力两极化

客服、软件开发生产力提升 14%-26%,但 22-25 岁年轻开发者就业降 20%;入门级岗位受冲击最大,资深岗位需求上升。

环境代价激增

AI 数据中心电力容量堪比纽约州峰值,Grok 4 训练碳排放超 7 万吨,GPT-4o 推理年耗水超 1200 万人饮用水需求。

四、科学与应用:落地加速,证据不足

科研颠覆式突破

AI 模型超越人类科学家,小参数模型凭数据优化实现大模型性能,合成数据在后训练阶段有效。

医疗落地提速,证据薄弱

临床 AI 减少医生 83% 笔记时间,但仅 5% 研究使用真实患者数据,验证体系缺失。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐