你有没有想过一个奇怪的事:ChatGPT能写出像样的代码,能搞定复杂的论文,但在最基础的事情上——它连三岁小孩都不如。

它不知道苹果是甜的,没摔过跤,也不明白"失去"是什么感觉。

最近arXiv上一篇新论文《Why AI systems don't learn and what to do about it》,加上技术圈的深度讨论,说出了一个让AI圈不得不承认的事实:LLM(大语言模型)很可能不是通往AGI(通用人工智能)的终点,而只是一个非常精巧的"局部最优解"。

这不是泼冷水,是时候清醒一下了。

差距一:它只是在预测,不是在学习

LLM的本质是什么?论文说得直白——它是"离线学习者"。

想象一个天才小孩被关进无限大的图书馆,他读遍了所有书,能完美记住每句话的下一个字。但他从没见过真实的苹果,没摸过粗糙的树皮,没感受过阳光的温度。

这就是LLM的现状。它在海量静态数据上玩"猜下一个词"的游戏,学的是人类语言的统计规律,不是世界怎么运转。

AGI需要的是"自主学习"。人类和动物都是通过在真实世界里试错、感受反馈来学习的——婴儿扔玩具,是为了搞懂重力;你摸过火,就知道疼。这种和现实世界的闭环反馈,才是智能的根本。

差距二:它在玩符号游戏,没有"世界模型"

技术圈讨论里提到了一个关键概念:"Grounding"——语义落地。

LLM处理的是符号(文字)之间的关系,不是符号和真实事物之间的关系。它知道"苹果是红色的"这句话怎么写,但不理解"红色"是什么样,也不知道"苹果"咬起来是什么感觉。

就像一个精通中文语法但从没来过中国的语言学家,他能分析"月是故乡明"用了什么修辞手法,但体会不到思乡的滋味。

真正的AGI需要"世界模型"——能预测物理规律、理解因果关系的认知框架。论文说得很清楚:没有物理感官和环境反馈,LLM的智能永远是"悬浮的、片面的、抽象的"。它知道苹果的百科知识,但不理解苹果本身的存在。

差距三:它走的是捷径,不是真理解

说个扎心的事:LLM表现出的推理能力,很多时候就是"随机鹦鹉"的升级版。

模型在训练中学会了大量统计学的套路。比如看到"因为...所以..."这样的句式,它就能猜出一种逻辑结构——但这不是真正的逻辑推导,是模式匹配。

一旦遇到训练集里完全没有的新逻辑结构,LLM的泛化能力会崩。而AGI的核心特质,恰恰是在完全未知情况下的通用泛化能力——就像你第一次看到火星车,不用重新学物理就能理解它怎么动。

差距四:它是一次性的,不能持续进化

现在的LLM有个根本问题:训练完,权重就固定了。

它做不到像生物大脑那样,在日常生活里持续吸收新知识、调整认知。要加新能力,得重新训练或者靠外部插件(RAG),这本质上是"外部记忆",不是"内部进化"。

AGI应该是一个活的系统,能根据即时经验改变思考方式。就像你今天学了个新概念,明天就会不自觉地用它来理解世界。这种"训练-推理"分离的架构,从根本上限制了LLM的进化可能。

那LLM到底是什么?

论文给了一个很到位的定义:LLM就是一个"超级图书馆+翻译机"。

它极大地提升了我们获取和处理信息的效率,是个特别有用的辅助工具。但它没有自主性、没有物理感知、不能持续学习,所以更像是通往AGI路上的一个"局部最优解",不是终点。

AGI的未来,可能在另一个方向。

论文说,真正的突破可能要借鉴神经科学和认知科学的路子:开发能自主感知、有物理实体反馈、能做因果推理的新架构。这不再是堆算力和语料的事儿,是对"智能本质"的重新思考。

可能我们离真正的AGI,还差一场范式革命。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐