不发新模型,却想「重写」整个科研流程:Anthropic 掏出 Claude Science,还砸了 10 万美金办黑客松

当所有人都盯着「下一个更大的模型」时,Anthropic 却在生命科学这条赛道上,做了一件看起来不那么「性感」、但可能更要命的事——它没有再发一个新模型,而是把科学家每天要在几十个数据库、终端、脚本和绘图工具之间反复横跳的那套「体力活」,一口气塞进了同一个工作台里。

近日,Anthropic 正式推出了 Claude Science——一个面向科研人员的 AI 工作台(AI workbench),目前处于 beta 阶段,率先聚焦生命科学领域。几乎同一时间,它还联合社区平台 Cerebral Valley 与旧金山知名生物医学研究机构 Gladstone Institutes,甩出了一场名为 Built with Claude: Life Sciences 的全球线上黑客松,奖池高达 10 万美元的 API 与使用额度。

一边是产品,一边是活动,这套「组合拳」背后的野心其实很清楚:Anthropic 不只想当那个卖模型的公司,它想直接占住科研工作流本身。


先说清楚:Claude Science 到底是什么,又不是什么

值得先泼一盆冷水的是——Claude Science 不是一个新模型,也不是一个「更懂生物学」的模型。

按 Anthropic 官方的说法,它跑的还是大家今天已经能用到的那批 Claude 模型(包括 Claude Opus 4.8),没有特殊权限,也没有额外门槛。它建立在 2025 年 10 月推出的 Claude for Life Sciences 之上,只不过那时是让聊天机器人「更会做生命科学的活儿」,而这一次,是给了这些活儿一个专门的「工作台」。

那科学家平时的痛点到底有多碎?

一个真实的科研日常大概是这样的:数据散落在 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 等一堆资源里,每一个都有自己的 schema 和查询语言;文献要去 PubMed 翻;分析要在 Jupyter、R 里跑;大任务还得连到集群终端上排队;中间各种文件格式还要写一堆定制化的数据管线才能读进来……光是「工具切换」这件事,就足以吃掉科研人员大量的时间。

Claude Science 想干的,就是把这一整条链路折叠进一个环境里。换句话说,它更像是「科研版的 Claude Cowork」——你用大白话描述一个研究任务,剩下的编排、查询、跑分析、出图,交给背后的一群 agent。


三层 Agent 架构:一个「项目经理」,一群「专家」,外加一个「杠精」

Claude Science 的内部结构,值得单独拎出来说。

当你抛出一个问题时,最先接手的是一个通用协调 agent,它更像是一个项目经理,手里握着 60 多个科学数据库和一整套技能(skills),负责把任务拆解、分派给下面的领域专家子 agent去执行——基因组学、单细胞、蛋白质组、结构生物学、化学信息学,各管一摊。

而真正让人眼前一亮的,是它还额外配了一个审阅 agent(reviewer agent),专门干一件事:挑刺。

众所周知,大模型有个老毛病——会一本正经地编造引用、编造数字。随着越来越多论文里混进 AI 写的内容,这种「幻觉出来的参考文献」正在成为科研诚信的隐患。Claude Science 的审阅 agent 会去检查那些无法溯源的图表数据、以及和代码对不上的引用,试图在人类发现之前,先把自己的错误抓出来。

当然,Anthropic 自己也承认:「说到底,还是同一个底层模型在自我检查」,它并不是一个独立的「真相来源」。这一点,值得任何想用它写论文的人保持清醒。


把「可复现」焊死在每一张图上

如果说 Agent 架构是它的「肌肉」,那「可复现性」就是 Anthropic 这次真正想立的招牌。

科研圈最头疼的复现难题,Claude Science 给出的方案相当硬核:它生成的每一张图(比如 3D 蛋白质结构、化学分子式),都会连带着附上生成它的那段精确代码、运行环境、一段大白话说明,以及完整的对话历史。

这意味着什么?几个月后你再回头看这张图,可以一路溯源到它是怎么来的。更妙的是,你还能用自然语言直接改图——比如让它「去掉网格线」或者「把某个坐标轴换成对数刻度」,agent 会回头去重写自己那段代码。

另一个容易被忽略但很关键的设计是:**它跑在你自己实验室的基础设施上,而不是把数据一股脑传到 Anthropic 的服务器。**它可以本地跑在 macOS 或 Linux 上,也可以通过 SSH、HPC 登录节点或 Modal 账户去调远端算力。折蛋白、跑基因组管线这种重活,交给 agent 去提交、盯梢、报错。

至于底层的「专业科学能力」,Anthropic 走了一条「不重复造轮子」的路线:它接入了 英伟达 BioNeMo Agent Toolkit,把 Evo 2、Boltz-2、OpenFold3 这些生命科学模型当作可调用的技能。用官方一句话来说——「专业的科学,交给造出它的伙伴」。


已经有人跑通了:从两年到十分之一的时间

产品好不好用,还得看真实用户。Anthropic 点名了几个早期使用者:

Allen Institute 的神经科学家 Jérôme Lecoq,搭了一个由约 20 个自定义技能组成的多 agent 模板,用来写长篇综述——子 agent 读了成千上万篇论文、抽取关键发现、存进数据库,再一段段把综述写出来。过去他的团队写一篇这样的综述可能要花上两年,现在他手里已经攒了大约 10 篇,很多都超过 100 页。

UCSF 的流行病学家 Stephen Francis,把它用在了脑胶质瘤的分子流行病学研究上。虽然这项工作早于 Claude Science,但他表示,这个应用把分析速度加快到了原来的十分之一左右。

还有专注于组织靶向药物的 Manifold Bio,用它来为最新实验筛选和提名靶点——权衡表面表达、运输和安全性等因素,而且能把过往项目的上下文一并带进来,端到端跑完整个任务。


退一步看:这是一场「工作流之战」,不是「模型之战」

把镜头拉远,你会发现 Claude Science 其实是 Anthropic 一盘更大的棋。

它想复制 Claude Code 的成功路径——**当年 Claude Code 成了软件团队的「操作层」,现在它想让 Claude Science 成为科研的「操作层」。**这背后押注的,是「工作流」而非「原始模型能力」。

而这条赛道,早已不止它一家:OpenAI 在 4 月推出了面向生物推理、且对企业客户设了门槛的 GPT-Rosalind;Google DeepMind 玩的则是另一套——它手里握着 AlphaFold、AlphaGenome 这些别人只能「调用」的基础科学模型,并把它们打包进 Gemini for Science。

换句话说,三家用三种完全不同的分发策略,在争夺同一批科研用户:Anthropic 走「广撒网 + 订阅普及」,OpenAI 走「窄门 + 企业封闭」,Google 则靠「独家自研模型」。这场博弈怎么收场,很可能会成为 AI 厂商未来在法律、金融、工程等垂直领域如何竞争的一个早期信号。

Claude Science 目前已在 macOS 和 Linux 上向 Pro、Max、Team、Enterprise 用户开放 beta,学术与非营利实验室还能拿到折扣席位。此外,Anthropic 还将资助最多 50 个研究项目、每个最高 3 万美元额度,Modal 另外为部分项目提供最高 2000 美元算力。申请截止到 7 月 15 日,项目将于 9 月 1 日至 12 月 1 日进行。


10 万美金、500 个名额:这场黑客松,值得你冲

聊完产品,回到那场黑客松。

Built with Claude: Life Sciences 是一场全球线上黑客松,时间为 7 月 7 日至 13 日,由 Anthropic、Cerebral Valley 和 Gladstone Institutes 联合举办。它不是一场泛泛的「随便建点什么」的比赛,而是一次明确指向「AI × 生物医学」交叉地带的定向出击。

这次一共设了两条赛道:

  • Research 赛道(「从实验台出发」):从你一直在琢磨的某个生物学问题起步,用 Claude Science 去给出一个具体的答案——一个发现、一个训练好的模型,或者一份别人能复现的分析。
  • Build 赛道(「走出实验台」):从一个你能叫得出名字的生命科学用户(一位科学家、一家诊所、一家生物科技公司)出发,用 Claude Code 造出他们缺的那个工具——一款能撑过这一周、真正能用的软件。

Research 赛道尤其诱人的地方在于,Anthropic 联合 Gladstone 旗下多个实验室,开放了一批独特的数据集供参赛者用 Claude Science 探索,比如:Alex Marson 实验室(联合 Stanford 的 Jonathan Pritchard)的 T 细胞 Perturb-seq 数据集、Katie Pollard 实验室用于预测调控活性的大规模并行报告基因实验、以及 Nevan Krogan 的蛋白质互作网络。

福利也很实在:主办方将从两条赛道中选出 500 名参与者,每人获得一个月的 Claude Max 20x200 美元 API 额度,用一周时间去建造。最终,大家将角逐 10 万美元的 Claude API 与使用额度奖池。评委阵容来自 Anthropic 和 Gladstone Institutes。

需要注意的是:活动全程线上,名额限 500 人每队最多 2 人,所有参与者都需提交申请并通过审核。作为参考,此前同系列活动曾从 2 万多份申请中选出 500 名建造者。想上车的,记得去 Cerebral Valley 报名页提交申请。


那么问题来了——**当一个 AI 工作台能把「找数据、跑分析、出图、查引用」全链路折叠进一句自然语言时,科研这件事的门槛,究竟会被拉低到什么程度?**它是真的在加速发现,还是只会制造更多「看起来像发现」的东西?

你怎么看?欢迎在评论区留言、交流!

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐