Claude创始人Dario Amodei坦白:百度十年前就确定了AI的今天Claude的正确技术路线!
·
前几天刷到一段Anthropic创始人Dario Amodei的采访,就是做Claude那家公司的CEO,他们公司现在估值都快上千亿美金了。
采访里他说2014年底到2015年底,他在百度硅谷的SVAIL实验室干了整整一年,跟着吴恩达的团队做DeepSpeech 2,还直言这段经历给了他做AI最关键的思路。 我当时看完一下就愣住了,怎么会是百度?现在百度市值也就四百亿出头,Anthropic一家公司估值都能抵好几个百度,结果Dario自己都说,他能走到今天,核心底子全是当年在百度攒下的。

他在十年前于百度工作期间,就已经观察到了如今大模型发展的核心规律——Scaling Law(扩展定律)。
以下是关于这一事件的详细事实梳理:
1. 核心事实:Dario的百度经历与发现
- 任职背景:2014年11月至2015年10月,Dario Amodei 在百度硅谷人工智能实验室(SVAIL)工作了一年。当时,AI大牛吴恩达担任百度首席科学家,主导“百度大脑”计划,Dario 参与了 DeepSpeech 2 语音识别项目的研发。
- 亲口承认:Dario 在采访中回忆,当时他直观地观察到,只要给模型投入越多的数据、计算资源和训练时间,模型的表现就会越好。这正是如今推动大模型发展的底层逻辑“Scaling Law”的雏形。
- 当时的局限:Dario 坦言,当时团队并没有对这一规律进行精确测量,且认为这可能只是语音识别领域的特殊情况,因此没有将其命名为“定律”或进行深度发表。
2. 百度的早期研究:比OpenAI更早的论文
除了Dario的直观感受,百度在学术上也留下了确凿的证据:
- 2017年论文:百度在2017年发表了一篇名为《DEEP LEARNING SCALING IS PREDICTABLE, EMPIRICALLY》的论文。该研究详细论证了在机器翻译、语言建模、图像处理和语音识别等领域,模型大小和泛化误差随着训练集规模的增长呈现出可预测的幂律关系。
- 时间线对比:这比业界普遍认为的 OpenAI 在2020年发表的《Scaling Laws for Neural Language Models》论文早了整整三年。只是百度当时使用的是LSTM架构而非Transformer,且没有使用“Scaling Law”这个命名,因此后来被外界忽视了。
3. 为什么百度“起了大早赶了晚集”?
尽管百度在十年前就踩准了“海量真实数据 + 深度学习”的正确路线,但在大模型时代的商业结果上却未能像OpenAI或Anthropic那样取得巨大的估值爆发。综合来看,原因包括:
- 技术路线的偶然性:Dario 和团队当时认为该规律可能仅适用于特定领域,直到后来在 OpenAI 看到 GPT-1 的结果,才确认其具有通用性。
- 商业化与战略重心:百度在AI上的坚持虽然值得肯定,但在将前沿理论转化为通用大模型产品、以及后续的资本运作和商业化落地上,可能差了“临门一脚”。
总结来说,Dario Amodei 的言论并非空穴来风。百度及其硅谷实验室确实在大模型时代的底层理论探索上具有极高的前瞻性,是全球最早验证“Scaling Law”的机构之一。这一事实不仅得到了当事人的证实,也得到了学术论文和多位AI领域专家的交叉印证。
更多推荐


所有评论(0)