昨天,火山引擎2026夏季FORCE原动力大会上,字节跳动正式发布豆包大模型2.1 Pro。

几个核心信息直接拉满:编程能力进入全球第一梯队、500个智能Agent同步协作完成3D城市搭建、综合使用成本较Claude Opus 4.6降低近80%、日均Token调用量突破180万亿。

编程能力正式追平Claude

豆包2.1 Pro在Terminal Bench 2.1、SWE-Pro、SciCode等多个代码评测中进入全球第一梯队。SciCode科学计算评测拿到59.8分,超过Claude Opus 4.7和GPT-5.5。在NL2Repo仓库级代码生成评测中,豆包2.1 Pro得分47,明显领先GPT-5.5和Gemini 3.1。

火山引擎总裁谭待在发布会上说了一句话:豆包2.1 Pro正式跨越了“生产级质变点”。

过去两年,大模型在“能写代码”和“能交付项目”之间隔着一道鸿沟。跨越质变点意味着模型不再停留在代码片段补全,而是能理解整个代码仓库,完成从需求分析到架构设计、代码生成到测试验证的完整链路。

现场演示了一个硬核案例:豆包2.1 Pro围绕一个16×16 PE的Tile TPU,连续运行18小时、经历9轮迭代,完成了6个核心模块、1300多行RTL代码,跑通了仿真测试和检测流程。这类任务通常需要3到5名资深工程师数周的努力。

500个Agent同步协作

另一个展示更具画面感:依托豆包2.1 Pro搭建了一个3D虚拟城市场景,500多个智能Agent同步协作,完成上千轮工具调用,最终生成超过100栋建筑。过程中不同Agent需要协调各自的任务、处理中途出错、动态调整步骤——几乎复现了一个小型数字施工队的运作方式。

Agent能力是豆包2.1 Pro的另一大亮点。依托强化的工具调用、函数调用、任务规划等能力,豆包2.1 Pro具备了从“被动问答”到“主动执行”的迁移能力。发布会现场展示的Agent协作场景,验证了模型在复杂环境下的调度与执行稳定性。

成本砍掉八成

价格方面,豆包2.1 Pro每百万Tokens输入6元、输出30元,缓存命中仅1.2元,综合使用成本较Claude Opus 4.6降低近80%。面向高频调用场景的豆包2.1 Turbo价格再减半。

字节跳动还同时发布了豆包视频生成模型Seedance 2.5(实现30秒单段原生视频直出、最多支持50个全模态素材联合生成)、图像创作模型Seedream 5.0 Pro和音频生成模型Seed-Audio 1.0。后者可将10秒语音样本扩展至5分钟任意说话人语音,真人发声相似度显著提升,支持音色克隆、语音风格迁移等功能。

180万亿Token调用量

截至今年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。在中国公有云MaaS服务市场,火山引擎以49.5%的份额位居第一。

这个数据的意义在于:豆包大模型已经不是“实验室模型”,而是经过真实业务场景大规模验证的生产级产品。字节跳动对内支撑了抖音、今日头条等核心业务,对外通过火山引擎向企业客户提供AI服务,豆包App用户规模也在持续扩大。

我的判断

GLM-5.2走开源路线,豆包2.1走闭源API路线——两条路径同时在验证国产模型的实力。

豆包2.1 Pro的发布意味着字节在视频生成之外,模型侧终于补上了Coding的拼图。从“能写代码”到“能交付项目”,国产模型正在集体跨越那道鸿沟。

过去一年,国产大模型的进步速度远超预期。参数规模从千亿到万亿,上下文从200K到1M,编程能力从“能用”到“能打”——每一次发布都在缩小与海外最强的差距。

如果你还没试过豆包2.1 Pro,建议去火山引擎官网申请体验。它可能改变你对“国产AI能做什么”的判断。

💬 你准备试豆包2.1吗?编程能力追平Claude,你会考虑切换吗?欢迎在评论区聊聊你的真实想法。

(本文基于2026年6月23日火山引擎夏季FORCE原动力大会公开信息撰写。勇哥AI实验室,关注AI怎么用。)

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐