AI 时代的瓶颈与 Perplexity

mit6.824

16人浏览 · 2026-07-02 21:00:21

mit6.824 · 2026-07-02 21:00:21 发布

在这里插入图片描述
1.AI 的瓶颈不是模型能力，是电力基础设施
2.模型不是产品，Orchestration才是关键
3.30人团队可以创造高盈利公司
4.AI Agent 带来的收入最终会超过广告收入

一、为什么"进攻"才是正确答案

1.1 “赢的渴望"胜于"失败的恐惧”

Aravind 被问及"你更被失败的恐惧驱动，还是被胜利的渴望驱动"时，他的回答是后者，原因是：

“我一无所有。我从未想象过自己能做成这些事情。我的人生已经超越了任何想象。”

1.2 永远保持进攻姿态

信奉的原则：

永远不要防守
全力以赴
持续进攻

当被问到"今天你在哪些方面不够激进"时，他承认早期在社交媒体上对 Google 的批评过于高调，但那是刻意的策略——因为 Google 根本不在乎一个"小公司"的批评，这反而帮助 Perplexity 获得了关注

1.3 AI 领域没有舒适区

“在 AI 领域，没有人能坐享其成。即使是 Anthropic，如果他们认为 Claude Code 已经赢了，6-12 个月后他们可能就不存在了”

这是这个领域"令人不舒服"的事实——没有谁能放松。

二、Perplexity 如何改变了 Google

Aravind 表示：

“Perplexity 改变 Google.com 的程度，超过了 Google 历史上任何产品经理所做的。”

他指出，现在 Google 的 AI Mode 看起来和 Perplexity 一模一样：

字体
引用格式
行内文本和超链接
建议的后续问题

整个体验都在模仿 Perplexity，但"质量仍然不如"

2.2 为什么这是好事

他并不为此感到不快，原因在于：

2024年底早就预料到这会发生
"答案引擎"只是起点，不是终点
前沿在转移——从"回答问题"到"替你工作"

“AI 的前沿不再是回答问题，而是真正出去为你完成任务。”

用户订阅 Perplexity Pro 或 Max，不是为了获取答案，而是为了：

获得复杂的研究报告
使用能代替他们执行任务的 Agent

三、真正的瓶颈：电力与基础设施

3.1 电力是第一瓶颈

Aravind 反复强调：当今最大的问题是电力短缺。

建设一个数据中心不仅仅是购买芯片，需要：

购置或租赁土地
与电力供应商/电网合作
处理冷却系统
获得各种许可

所有这些都比购买芯片慢得多。

3.2 数据中心建设的物理限制

他提到：

40% 的数据中心项目因为公众阻力而无法推进
Blackwell 架构的模型（如 Llama）已经很"可怕"
Rubin 架构（明年）会更强大
模型训练需要百万级 GPU

“物理基础设施的建设时间总是限制前沿能力。”

3.3 公众阻力来自哪里

他认为数据中心的阻力被误导了：

人们错误地认为数据中心消耗大量水资源
电费上涨归咎于数据中心建设
实际原因是多方面的：就业担忧、财富不平等恐惧、环境问题等

这导致电力成为持续的瓶颈。

3.4 未来的瓶颈预测

当被问及"三年后我们没讨论的瓶颈是什么"时，他的回答是：电力将继续是瓶颈。

除非数据中心的建设方式发生根本性变化，否则这种情况不会改变。

四、编排问题：AI 的真正价值所在

4.1 模型不再是产品

Greg Brockman 最近发推说"模型不再是产品"，Aravind 完全同意这个观点：

“如果你只是一个模型 Token 的转售商，你没有业务。因为模型会被商品化。”

即使你是模型构建者，如果你只是转售原始模型输出，也没有业务。

4.2 Agent Harness

以 Codex 或 Perplexity Computer 为例，它们是编排系统：

将模型与 Agent 工具结合
定义 Agent 循环如何运行
管理技能、子 Agent 和连接器
决定访问哪些工具

没有 Harness，模型的内置智能无法被有效转化为有价值的输出 Token。

4.3 Perplexity 的差异化

编排策略：

跨模型编排：Anthropic 和 OpenAI 不能声称做到这一点——你不会在 Claude Code 的 Harness 里找到 GPT-5，也不会有 Claude Opus 4.7/8 在 Codex 里
但会在 Perplexity Computer 里找到两者
跨工具和连接器编排

4.4 指标：每瓦每用户的 Token 价值

“谁用最少的电力生产最有价值的输出 Token，谁就创造最大价值。”

这是一个编排问题

4.5 24/7 AI 如何实现

大多数人担心 AI 会"做疯狂的事情"，但真正的担忧是成本——没有人能负担得起一直运行前沿 AI。

解决方案：

本地模型处理日常任务
服务端模型处理复杂任务
编排层协调两者

“构建一个持续学习的本地模型，在必要时才调用服务端前沿模型”

五、Agent 的使用与价值创造

5.1 权力用户的行为

Perplexity Computer 上有用户每月花费超过 10,000 美元。这不是浪费钱，他们的业务就是靠这些 Agent 循环运转的。

这些用户创建的多 Agent 层级和 Agent 循环，看起来像是自己的软件架构。

5.2 区分高价值用户的关键

使用 Agent 做重复性 cron 任务 vs 一次性任务：

一次性任务：委托一个任务，完成即止
持续任务：AI 持续监控，触发事件时自动执行

例子：

每次收到入站邮件自动分类
检测到延迟尖峰时自动进行根因分析
识别并通知相关工程师

5.3 规模预测

这些产品不会拥有 1 亿用户。但它们产生的收入将超过 Google 或 Meta 的广告收入。

5.4 Token 支出占工资比例的演变

Marc Benioff 提到 Salesforce 在 Anthropic 上花费 3 亿美元（约占开发者工资的 3.8%）

Aravind 预测：

如果保持在 3.8%，Anthropic/OpenAI 不会是 5 万亿美元公司
如果达到 100%（如 Brandon McCarthy 预测），他们将成为 10 万亿美元公司

但成本可能下降，因为：

开源模型性能提升，价格更低
更好的 Harness 弥补模型差距

永远会为前沿付费，但前沿在不断变化

六、基础设施层的价值

6.1 为什么 Micron 可能比 Meta 更有价值

Aravind 认为 Micron（内存供应商）在未来 6-12 个月可能比 Meta 更有价值：

HBM 内存价格已经涨了 5 倍
瓶颈定价
内存是当前最稀缺的资源之一

6.2 CPU 的回归

由于 Agent 大量使用 CPU：

Agent 生成代码后，在 CPU 上执行
下载文件、处理数据、生成图表、托管网站——全部在 CPU 上运行

“Agent 使用 CPU 的比例比人类还高。”

这让 Intel 和 AMD 重新成为受益者。

6.3 数据中心供应商的可持续性

CoreWeave 等公司可以持续，但：

不能只是服务器租赁商
需要在软件层进行编排
需要获得 100,000 GPU 的容量保证
需要创新发电层

AWS 的名字是"Amazon Web Services"，不是"Amazon Servers"——软件编排才是价值所在

6.4 推理层能否独立存在

可以，但有条件：

假设需要 100 亿美元收入（约 10 亿美元利润）
开源模型必须持续强大
如果开源与前沿差距超过 12-15 个月，这些公司就会失去商业模式

七、出口管制

7.1 短期效应

出口管制帮助美国保持领先：

创造了开源与前沿之间 12 个月的差距
让中国公司无法获得最新的 GPU 和 HBM

7.2 长期风险

原因：

中国被迫在硬件层垂直整合
他们在华为栈上构建
架构更加内存高效
KV Cache 创新——可以放在 SSD 上，不需要 HBM
训练算法不依赖高带宽互联

建立完全不同的推理架构和存储架构

7.3 AI 的物理维度

Aravind 认为美国低估了中国的能力，因为 AI 不只是数字的，还包括：

电力，许可证，劳动力，专业知识，建设速度，晶圆厂，机器人，芯片，能源利用…

中国在这些领域都有优势

7.4 TSMC 在美国的角色

TSMC 正在亚利桑那州建设工厂
投资 1500 亿美元
已经投入 400-600 亿美元
美国政府持有 Intel 10% 股份

八、小团队创造大价值

8.1 Perplexity 的示范效应

400 人创造 200 亿美元公司
理论上：40 人可以创造 10-20 亿美元公司
4000 人可能创造 2000 亿美元

8.2 创业门槛的改变

“如果你曾经无法创业的原因是’需要雇佣很多人、需要租办公室’——这种情况在历史上第一次改变了。”

现在你可以：

和一两个朋友开始
真正有机会创建一个 10 亿美元的公司

Perplexity 自己起步时获得了约 100 万美元的云计算积分。

8.3 Perplexity 的"Billion Dollar Build"计划

他们正在向任何有可信路径创建 10 亿美元公司的团队提供 100 万美元云计算积分。

8.4 未来企业结构

最佳公司会：

更加精简高效
员工数量大幅减少
但每个团队价值更高

“我宁愿有 100 万人分成 1000 个团队，每个团队值几亿美元。”

九、广告模式的未来

9.1 为什么聊天界面不适合广告

发现模式不同：旅行/购物需要"探索"，而非"对话"
用户意图不同：浏览 Instagram vs 问 ChatGPT 问题
信任问题：当你需要准确答案时，广告会破坏信任

9.2 `客观 vs 主观判断`

类型	决策特点	商业模式
客观决策	基于`事实和数据`	Agent 颠覆
主观决策	基于审美和感受	广告支撑

旅行、购物、时尚——大多数仍然是主观的。任何基于客观判断的交易都会被 Agent 颠覆。

9.3 对 Meta 的影响

Meta 正在推出 $200/月的 Agent 产品，这说明他们意识到订阅模式才是出路。

十、Agent 流量时代的互联网

10.1 Cloudflare 的数据

Agent 流量已经超过人类流量，这个变化来得比预期更快。

10.2 网站不会消失

Aravind 认为：

网站不会消失
设计仍然重要
广告模式不会完全死亡

因为：

主观内容（时尚、家具）仍然需要人类浏览
Agent 流量会替代客观搜索，但不会替代所有互联网活动

十一、OpenAI 的 IPO 问题

11.1 为什么 OpenAI 没准备好 IPO

他明确表示OpenAI 没有为 IPO 做好准备，原因：

虽然是主导消费产品，但没有钱
ChatGPT 已经被商品化
收入来源：用户订阅 + Codex（代码执行）

11.2 消费 AI 没有钱

“在非广告领域——订阅或使用量计费——钱在前沿。今天的前沿是替你完成任务。”

11.3 Perplexity 的 IPO 时间表

目标：2028 年或更早
收入增长比盈利能力更重要
公开市场目前更看重收入增长而非利润

十二、Perplexity 的技术路线

12.1 自训练模型

Perplexity 正在：

基于顶级开源模型进行后训练
目标是减少对前沿模型 Token 的依赖
保持前沿模型用于新能力探索

“今天产品中已有的功能，我们期望完全依赖自己拥有和服务的模型。这将是降低成本和增加利润的最佳方式。”

12.2 收入与成本

自今年年初以来收入增长超过 3 倍
成本消耗减少超过 50%
Anthropic 模型进步对他们是好事
OpenAI 竞争降低同等能力成本，也是好事

12.3 开源模型的持续改进

“如果开源模型停止变得强大，如果它们与前沿的差距超过 15-18 个月，那这些推理公司就没有商业模式。”

十三、对竞争对手的看法

13.1 Google 的 AI 问题

Google 具备所有成为最低成本 Token 生产者的条件：

自有 TPU
自有数据中心
自有网络
自有电力采购

但他们严重低估了代码模型的重要性，目前在前沿之外。

13.2 Anthropic 的生存危机

“如果 Anthropic 认为 Claude Code 已经赢了——6-12 个月后他们可能就不存在了。”

**前沿模型提供商只有在前沿时才有价值。**如果 6 个月没有新能力，就是危险的信号。

13.3 对 Cursor 的评价

当被问及 San Francisco 的 AI 聚会上有人说 Perplexity 是"最容易失败"的公司时：

“Cursor 可能会被收购。xAI 是我的孩子。”

而 Perplexity：

收入增长 3 倍
成本消耗减少 50%

“大多数参加这些聚会的人实际上不构建任何有用的东西。”

十四、关于财富与公平

14.1 财富分配的思考

他承认对财富不平等的担忧，但认为解决之道是**广泛分配利益**。

他分享了一个真实故事：

一位 Uber 司机看了他的 YouTube 采访
学会了如何用 AI 从零开始构建 Web 应用
现在做 App 获得的被动收入比开 Uber 还多
他减少了开车时间，因为更喜欢编程

14.2 `信念`

“如果你持续只报道负面消息——AI 和不平等——人们只会想到坏事。所以，如果你认为自己做得不错，就应该多谈谈积极的可能性。”

“普通人更需要的是看到可能性，然后受到激励去行动。”

14.3 财富观

“财富不会激励我。影响力才会。”

十五、学到的

15.1 Elon Musk 的特质

极度专注——Twitter 上的表现可能具有误导性
每次只关注一个限制性问题
忽略其他一切

“这种能力——只关注当下的限制因素，忽略其他一切——非常难学。”

15.2 Jensen Huang 的特质

对真相极度渴求
每天醒来告诉自己"我很糟糕"
公司值 5 万亿美元，却用"公司 30 天内可能倒闭"的思维经营

“这就是成为 Jensen Huang 所需的。”

15.3 共同点

两人都有宏大的长期愿景：

Musk 的太空计划：火星殖民地，百万居民
财富只是副产品

“如果你的成功定义是’赢得比赛然后卖掉公司’，然后就待在家里——你的孩子不会受到激励去行动。”

十六、AI 时代最重要的技能

16.1 问更好的问题

Aravind 在毕业典礼演讲中提到：AI 时代定义的技能是"问更好的问题"。

16.2 没人问的核心问题

“假设你有大量 Agent 可用，你会做什么？”

这不是技术问题，而是目的问题。

16.3 框架：10 年 vs 10 个月

“如果有人告诉你一件事需要 10 年，问：‘什么能让它 10 个月完成？’”

十七、对垂直 AI 实验室的看法

17.1 不相信大多数"新实验室"

太多只是"为了建实验室而建实验室"，没有差异化。

17.2 什么才是值得的

值得投资的垂直模型

质疑 Transformer 架构本身
质疑是否需要基于 Nvidia GPU
针对机器人等特定领域的模型

DeepSeek 是一个例外——他们：

是水平模型，不是垂直模型
不是从大实验室分拆出来的
但他们提出了非常不同的技术赌注

十八、Perplexity 如何成为 3 万亿美元公司

18.1 路径

“编排层。准确性和编排——这是自公司成立以来一直坚持的两个目标。”

编排层将涵盖：

设备
芯片
模型
工具
文件
连接器

18.2 他自己被问到的终极问题

问：你会拿 SpaceX、Anthropic 还是 OpenAI？

答：SpaceX。

“Anthropic 和 OpenAI 做的事情，其他公司也在做。但 SpaceX 是唯一建造太空基础设施的公司。”

十九、对毕业生的建议

保持好奇心

具体而言：

不要被 FOMO（错失恐惧）驱动，试图在短期内最大化收益
不要因为看到前沿实验室赚大钱而觉得自己是失败者
还有很多可以构建的东西

附录

术语	解释
Agent Harness	Agent 编排系统，定义 Agent 循环如何运行、管理工具和连接器
Token Value Per Watt	每瓦电力产生的 Token 价值，关键效率指标
Orchestration	编排，跨模型、工具、设备协调任务的能力
HBM (High Bandwidth Memory)	高带宽内存，GPU 训练的关键组件
KV Cache	Transformer 中的键值缓存，优化推理效率
Agent Loop	Agent 循环，AI 持续监控和响应事件的机制
Cron Jobs	定时任务，Agent 自动执行重复性工作

总结：十个核心takeaways

电力是真正的瓶颈——比模型能力更重要
模型是商品，编排是差异化——Perplexity 能在同一个产品中使用 Claude 和 GPT
前沿在移动——从"回答问题"到"替你工作"
小型团队可以做大公司——400 人可以创造 200 亿美元
出口管制短期帮美国，长期帮中国——迫使中国垂直整合
内存和 CPU 是新瓶颈——Micron 可能比 Meta 更有价值
广告不适合聊天界面——信任和用户意图模式不匹配
自训练模型降低成本——Perplexity 的策略
问问题是核心技能——不是技术能力，而是提出正确问题的能力
永远不要防守——这是 Aravind 的信条，也是 AI 时代生存的关键

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

Claude Fable 5 解封实测：三个坑 + 一个更稳的调用方案

AI编程社区

自定义命令，告别手敲重复指令

简单说，就是把一段你经常用到的提示词、指令甚至脚本，打包成一个以开头的快捷命令。比如你创建一个/test请为当前打开的 Java 类生成 JUnit 5 单元测试，覆盖主要分支，使用 Mockito mock 依赖。测试类放到 `src/test/java` 下，类名加上 `Test` 后缀。之后，你只要在 Claude Code 里敲/test，它就会自动按这个套路生成测试。不用每次再啰嗦一遍。

AI编程社区

Windows安装ClaudeCode亲测可用版

本文介绍了解决ClaudeCode使用问题的四个步骤：1)修改npm国内镜像源提升下载速度；2)通过创建.claude.json文件并写入{"hasCompletedOnboarding":true}来绕过地区限制；3)配置环境变量，包括API地址、密钥和模型参数，建议使用DeepSeek代理服务；4)在PowerShell中允许执行claude命令。这些设置可帮助用户解决连接Anthropic服

AI编程社区

所有评论(0)

查看更多评论

mit6.824

@2301_80171004

已为社区贡献10条内容

AI 时代的瓶颈与 Perplexity

mit6.824

一、为什么"进攻"才是正确答案

1.1 “赢的渴望"胜于"失败的恐惧”

1.2 永远保持进攻姿态

1.3 AI 领域没有舒适区

二、Perplexity 如何改变了 Google

2.2 为什么这是好事

三、真正的瓶颈：电力与基础设施

3.1 电力是第一瓶颈

3.2 数据中心建设的物理限制

3.3 公众阻力来自哪里

3.4 未来的瓶颈预测

四、编排问题：AI 的真正价值所在

4.1 模型不再是产品

4.2 Agent Harness

4.3 Perplexity 的差异化

4.4 指标：每瓦每用户的 Token 价值

4.5 24/7 AI 如何实现

五、Agent 的使用与价值创造

5.1 权力用户的行为

5.2 区分高价值用户的关键

5.3 规模预测

5.4 Token 支出占工资比例的演变

六、基础设施层的价值

6.1 为什么 Micron 可能比 Meta 更有价值

6.2 CPU 的回归

6.3 数据中心供应商的可持续性

6.4 推理层能否独立存在

七、出口管制

7.1 短期效应

7.2 长期风险

7.3 AI 的物理维度

7.4 TSMC 在美国的角色

八、小团队创造大价值

8.1 Perplexity 的示范效应

8.2 创业门槛的改变

8.3 Perplexity 的"Billion Dollar Build"计划

8.4 未来企业结构

九、广告模式的未来

9.1 为什么聊天界面不适合广告

9.2 客观 vs 主观判断

9.3 对 Meta 的影响

十、Agent 流量时代的互联网

10.1 Cloudflare 的数据

10.2 网站不会消失

十一、OpenAI 的 IPO 问题

11.1 为什么 OpenAI 没准备好 IPO

11.2 消费 AI 没有钱

11.3 Perplexity 的 IPO 时间表

十二、Perplexity 的技术路线

12.1 自训练模型

12.2 收入与成本

12.3 开源模型的持续改进

十三、对竞争对手的看法

13.1 Google 的 AI 问题

13.2 Anthropic 的生存危机

13.3 对 Cursor 的评价

十四、关于财富与公平

14.1 财富分配的思考

14.2 信念

14.3 财富观

十五、学到的

15.1 Elon Musk 的特质

15.2 Jensen Huang 的特质

15.3 共同点

十六、AI 时代最重要的技能

16.1 问更好的问题

16.2 没人问的核心问题

16.3 框架：10 年 vs 10 个月

十七、对垂直 AI 实验室的看法

17.1 不相信大多数"新实验室"

17.2 什么才是值得的

十八、Perplexity 如何成为 3 万亿美元公司

18.1 路径

18.2 他自己被问到的终极问题

十九、对毕业生的建议

附录

总结：十个核心takeaways

所有评论(0)

9.2 `客观 vs 主观判断`

14.2 `信念`