豆包2.1 Pro发布：编程追平Claude，500个Agent同步协作

Laboratory_yong

363人浏览 · 2026-06-24 10:43:19

Laboratory_yong · 2026-06-24 10:43:19 发布

昨天，火山引擎2026夏季FORCE原动力大会上，字节跳动正式发布豆包大模型2.1 Pro。

几个核心信息直接拉满：编程能力进入全球第一梯队、500个智能Agent同步协作完成3D城市搭建、综合使用成本较Claude Opus 4.6降低近80%、日均Token调用量突破180万亿。

编程能力正式追平Claude

豆包2.1 Pro在Terminal Bench 2.1、SWE-Pro、SciCode等多个代码评测中进入全球第一梯队。SciCode科学计算评测拿到59.8分，超过Claude Opus 4.7和GPT-5.5。在NL2Repo仓库级代码生成评测中，豆包2.1 Pro得分47，明显领先GPT-5.5和Gemini 3.1。

火山引擎总裁谭待在发布会上说了一句话：豆包2.1 Pro正式跨越了“生产级质变点”。

过去两年，大模型在“能写代码”和“能交付项目”之间隔着一道鸿沟。跨越质变点意味着模型不再停留在代码片段补全，而是能理解整个代码仓库，完成从需求分析到架构设计、代码生成到测试验证的完整链路。

现场演示了一个硬核案例：豆包2.1 Pro围绕一个16×16 PE的Tile TPU，连续运行18小时、经历9轮迭代，完成了6个核心模块、1300多行RTL代码，跑通了仿真测试和检测流程。这类任务通常需要3到5名资深工程师数周的努力。

500个Agent同步协作

另一个展示更具画面感：依托豆包2.1 Pro搭建了一个3D虚拟城市场景，500多个智能Agent同步协作，完成上千轮工具调用，最终生成超过100栋建筑。过程中不同Agent需要协调各自的任务、处理中途出错、动态调整步骤——几乎复现了一个小型数字施工队的运作方式。

Agent能力是豆包2.1 Pro的另一大亮点。依托强化的工具调用、函数调用、任务规划等能力，豆包2.1 Pro具备了从“被动问答”到“主动执行”的迁移能力。发布会现场展示的Agent协作场景，验证了模型在复杂环境下的调度与执行稳定性。

成本砍掉八成

价格方面，豆包2.1 Pro每百万Tokens输入6元、输出30元，缓存命中仅1.2元，综合使用成本较Claude Opus 4.6降低近80%。面向高频调用场景的豆包2.1 Turbo价格再减半。

字节跳动还同时发布了豆包视频生成模型Seedance 2.5（实现30秒单段原生视频直出、最多支持50个全模态素材联合生成）、图像创作模型Seedream 5.0 Pro和音频生成模型Seed-Audio 1.0。后者可将10秒语音样本扩展至5分钟任意说话人语音，真人发声相似度显著提升，支持音色克隆、语音风格迁移等功能。