林伽一 · AI 科技日报|今日AI圈最值得关注4件事
·
[重磅] Stanford DeLM: 去中心化多 Agent 架构的范式转变
# 传统集中编排器的问题示意
class CentralOrchestrator:
def process_task(self, tasks):
# 瓶颈:所有任务必须经过统一调度
# 信息稀释:中间层丢失关键上下文
# 过载风险:随任务数增长而线性恶化
for task in tasks:
context = self.extract_context(task)
result = self.agent.execute(context)
self.validate(result)
return results
DeLM 解决方案:用共享的验证 gist 上下文替代中央编排器,Agent 直接读写。在 SWE-bench 上每任务成本降低 50%,同时在多文档问答上超越 GPT-5.4、Claude Sonnet 和 Gemini Flash。
工程启示:多 Agent 系统的可扩展性关键在于减少中心节点的耦合度。
2️⃣ [工具] Vercel Connect & eve: AI Agent 生产级基础设施
Vercel 发布 Connect 公开测试版,核心改进:
-
✅ 运行时凭证交换替代长期提供者令牌
-
✅ 沙盒计算环境隔离敏感操作
-
✅ 审批流程内置防止越权调用
-
✅ 子 Agent 管理支持嵌套任务执行
eve 框架同步开源,内置持久化执行机制,让开发者专注 Agent 行为而框架处理生产问题。
代码示例:
// Vercel Connect 使用方式
const { connect } = require('@vercel/connect');
const agent = connect({
provider: 'anthropic',
credentials: { exchange: 'runtime' } // 关键改动
});
3️⃣ [模型] GLM-5.2 性能对比与工程实践
基准测试结果(FrontierSWE):
|
模型 |
得分 |
上下文窗口 |
成本指数 |
|---|---|---|---|
|
GLM-5.2 |
87.3% |
1M token |
1x |
|
GPT-5.5 |
86.9% |
~200K token |
6x |
|
Claude Opus 4.8 |
88.1% |
~200K token |
8x |
推理优化要点:
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained(
"THUDM/glm-5-2",
torch_dtype=torch.float16,
device_map="auto",
max_position_embeddings=1_000_000 # 1M 上下文配置
)
适用场景:长周期编码任务、多文件项目理解、历史追溯分析。
4️⃣ [研究] Mobileye Robotaxi 技术栈拆解
感知层:基于 EyeQ 系列芯片的多传感器融合方案
决策层:自研路径规划算法 + 高精地图定位
控制层:线控底盘接口标准化
部署时间表:
-
2027 Q1: 美国某城市 100 辆试点运营
-
2028: 扩展至 1000 辆
-
2031: 目标 1.7 万辆规模化
更多推荐



所有评论(0)