Claude创始人Dario Amodei坦白：百度十年前就确定了AI的今天Claude的正确技术路线！

跨境数据猎手

267人浏览 · 2026-06-24 08:38:35

跨境数据猎手 · 2026-06-24 08:38:35 发布

前几天刷到一段Anthropic创始人Dario Amodei的采访，就是做Claude那家公司的CEO，他们公司现在估值都快上千亿美金了。

采访里他说2014年底到2015年底，他在百度硅谷的SVAIL实验室干了整整一年，跟着吴恩达的团队做DeepSpeech 2，还直言这段经历给了他做AI最关键的思路。我当时看完一下就愣住了，怎么会是百度？现在百度市值也就四百亿出头，Anthropic一家公司估值都能抵好几个百度，结果Dario自己都说，他能走到今天，核心底子全是当年在百度攒下的。

他在十年前于百度工作期间，就已经观察到了如今大模型发展的核心规律——Scaling Law（扩展定律）。

以下是关于这一事件的详细事实梳理：

1. 核心事实：Dario的百度经历与发现

任职背景：2014年11月至2015年10月，Dario Amodei 在百度硅谷人工智能实验室（SVAIL）工作了一年。当时，AI大牛吴恩达担任百度首席科学家，主导“百度大脑”计划，Dario 参与了 DeepSpeech 2 语音识别项目的研发。
亲口承认：Dario 在采访中回忆，当时他直观地观察到，只要给模型投入越多的数据、计算资源和训练时间，模型的表现就会越好。这正是如今推动大模型发展的底层逻辑“Scaling Law”的雏形。
当时的局限：Dario 坦言，当时团队并没有对这一规律进行精确测量，且认为这可能只是语音识别领域的特殊情况，因此没有将其命名为“定律”或进行深度发表。

2. 百度的早期研究：比OpenAI更早的论文

除了Dario的直观感受，百度在学术上也留下了确凿的证据：

2017年论文：百度在2017年发表了一篇名为《DEEP LEARNING SCALING IS PREDICTABLE, EMPIRICALLY》的论文。该研究详细论证了在机器翻译、语言建模、图像处理和语音识别等领域，模型大小和泛化误差随着训练集规模的增长呈现出可预测的幂律关系。
时间线对比：这比业界普遍认为的 OpenAI 在2020年发表的《Scaling Laws for Neural Language Models》论文早了整整三年。只是百度当时使用的是LSTM架构而非Transformer，且没有使用“Scaling Law”这个命名，因此后来被外界忽视了。

3. 为什么百度“起了大早赶了晚集”？

尽管百度在十年前就踩准了“海量真实数据 + 深度学习”的正确路线，但在大模型时代的商业结果上却未能像OpenAI或Anthropic那样取得巨大的估值爆发。综合来看，原因包括：

技术路线的偶然性：Dario 和团队当时认为该规律可能仅适用于特定领域，直到后来在 OpenAI 看到 GPT-1 的结果，才确认其具有通用性。
商业化与战略重心：百度在AI上的坚持虽然值得肯定，但在将前沿理论转化为通用大模型产品、以及后续的资本运作和商业化落地上，可能差了“临门一脚”。

总结来说，Dario Amodei 的言论并非空穴来风。百度及其硅谷实验室确实在大模型时代的底层理论探索上具有极高的前瞻性，是全球最早验证“Scaling Law”的机构之一。这一事实不仅得到了当事人的证实，也得到了学术论文和多位AI领域专家的交叉印证。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

闭源大模型的信任红利正在耗尽，企业 AI 必将走向本地模型和开源 Agent——以端脑科技为例

AI编程社区

Codex 额度总是不够用？先判断是任务问题，还是套餐问题

使用 Codex 时经常遇到额度不足，并不一定说明当前套餐不合适。任务范围、项目体积、上下文长度和执行方式，都会影响实际消耗。本文从开发场景出发，分析 Codex 额度消耗较快的原因，并给出更合理的使用与选择思路。

AI编程社区

2026最新GPT充值完整教程：从基础充值到升级Pro，解锁全部AI高阶能力

本文针对国内用户使用ChatGPT的痛点，结合2026年最新规则，全面拆解免费版、Plus版、Pro版三大GPT版本的权益差异与适用人群，详解国内零踩坑、无需海外账户的GPT正规充值与Pro升级流程，汇总充值避坑要点。文章重点剖析了Plus会员高频限流、功能受限等短板，阐明GPT Pro顶配会员在无限算力、高阶模型、Sora视频生成、专属稳定通道等方面的核心优势，明确程序员、创作者、科研人员、职场