SenseNova-SI：重新定义AI空间智能新高度

邵玫婷

383人浏览 · 2026-04-01 04:00:57

邵玫婷 · 2026-04-01 04:00:57 发布

SenseNova-SI：重新定义AI空间智能新高度

【免费下载链接】SenseNova-SI-1.4-InternVL3-8B 项目地址: https://ai.gitcode.com/SenseNova/SenseNova-SI-1.4-InternVL3-8B

导语：SenseNova-SI系列模型通过800万至2900万级空间智能数据训练，在物体定位、深度估计等关键任务上超越主流开源模型，部分指标接近GPT-5等闭源大模型，标志着AI空间理解能力迈入实用化阶段。

行业现状：空间智能成为多模态AI的"最后一块拼图"

随着GPT-4V、Gemini等多模态大模型的普及，AI已能初步理解图像内容，但在处理空间关系推理（如"桌子上方的红色杯子"）、三维深度估计（如"两个物体的实际距离"）和场景布局分析（如"卧室窗户的朝向"）等空间智能任务时仍存在显著短板。根据EASI基准测试数据，现有开源模型在VSI（视觉空间推理）和MMSI（多模态空间智能）等专项测试中平均得分不足40分，远低于人类水平。

这种能力缺口严重限制了AI在机器人导航、家居设计、AR/VR等领域的应用。例如，当智能助手无法准确判断"冰箱左侧的调料瓶"位置时，便无法完成协助取物的指令；当自动驾驶系统无法精确估算与前车的三维距离时，可能导致安全隐患。因此，空间智能已成为衡量下一代多模态AI实用性的核心指标。

模型亮点：数据驱动的空间智能突破

SenseNova-SI系列模型基于InternVL3、Qwen3-VL等成熟多模态架构，通过系统性构建的SenseNova-SI-8M数据集（包含800万标注样本）实现空间智能的定向强化。最新发布的SenseNova-SI-1.4-InternVL3-8B模型在多项关键指标上实现突破：

1. 全方位空间能力提升

在8项主流空间智能 benchmark 中，该模型以平均66.6分的成绩超越所有开源竞品，其中MindCube-Tiny（空间立方体推理）得分高达88.8分，显著领先第二名（GPT-5为56.3分）。在深度估计任务中，其相对深度准确率达到95.56%，绝对深度估计精度提升至80.31%，较基础模型InternVL3提升近6倍。

这张图片展示了工程设计场景中的建筑平面图应用，恰如SenseNova-SI模型处理空间信息的能力——就像人类设计师解读蓝图一样，AI现在能精确理解物体的位置关系、尺寸比例和空间布局。这种能力为建筑设计、室内规划等领域的AI辅助工具奠定了基础。

2. 专业化场景优化

针对实际应用需求，模型在物体定位（RefCOCO avg 89.21分）和数量统计（CountBench 78.64分）任务上表现突出。例如在浴室场景中，模型能准确判断"卫生纸与毛巾哪个更靠近洗手台"，在拥挤人群图像中精确统计人数。这种能力源于训练数据中包含的2900万标注样本，覆盖从微观物体到宏观场景的各类空间关系。

该图片呈现了典型的浴室场景，其中卫生纸、毛巾与洗手台的相对位置关系是空间智能的基础测试案例。SenseNova-SI能像人类一样快速判断物品间的空间联系，这种能力可直接应用于智能家居控制、机器人导航等需要环境理解的场景。

3. 轻量化与泛化能力平衡

尽管性能强大，SenseNova-SI-1.4-InternVL3-8B仍保持80亿参数规模，可在单GPU设备上运行。通过多样化数据训练，模型展现出涌现性泛化能力，能处理训练数据中未见过的空间场景。例如在卧室布局推理中，给定"风景画在东侧墙面"的条件，模型能准确推断出窗户位于西侧（MMSI基准测试得分40.1分，超越GPT-5的38.0分）。

行业影响：开启空间智能应用新纪元

SenseNova-SI的推出将加速多个领域的智能化进程：在机器人领域，更精准的空间定位能力使服务机器人能更安全地避障和操作物体；在家居设计中，AI可根据户型图自动生成符合人体工程学的家具布局；在AR/VR领域，模型能实时将虚拟物体与真实空间融合，提升沉浸感。

值得注意的是，该系列模型已完全开源，包括从20亿参数到80亿参数的多个版本，开发者可根据场景需求选择部署方案。这种开放策略有望推动空间智能技术的快速迭代，正如项目README中所述："所有新训练的多模态基础模型均公开发布，以促进该方向的进一步研究"。

结论与前瞻：从感知到理解的跨越

SenseNova-SI系列通过"大规模专项数据+成熟基础模型"的技术路线，证明了数据质量对特定能力强化的关键作用。其2900万标注样本构建的空间智能训练体系，为行业提供了可复用的方法论。随着未来与更大规模自研模型的融合（项目方透露的"in-house models"计划），空间智能的应用边界将进一步扩展。

从识别物体到理解空间，AI正在完成从"看见"到"看懂"的进化。SenseNova-SI不仅是技术突破的里程碑，更预示着智能助手、机器人、自动驾驶等产品将进入"空间理解"的新阶段——当AI能真正"理解"物理世界的空间规则时，人机交互将迎来质的飞跃。

【免费下载链接】SenseNova-SI-1.4-InternVL3-8B 项目地址: https://ai.gitcode.com/SenseNova/SenseNova-SI-1.4-InternVL3-8B

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

爆改增强 Codex App，API 用户不再尴尬

用 API 跑 Codex 的人，最烦的往往不是模型不够强，而是桌面体验少一块。官方账号的插件、Goal、Computer Use 是完整的，你走 API 或第三方模型，胜在自由，但很多体验不一定都有。Codex++ 火起来，就是因为它盯上了这个缝。先别误会，因为 Codex App 本来就有官方插件、集成和 MCP。Codex++ 这个项目不是 OpenAI 官方功能，也不是官方插件商店。它是玩

AI编程社区

React Page组件化开发：掌握Facebook推荐的组件组织架构

React Page是Facebook官方推出的React应用开发框架，专为组件化开发而设计。这个强大的工具让您能够轻松构建服务器端渲染的React应用，实现快速页面加载和优秀的SEO效果。React Page组件化开发的核心思想是将整个页面视为可组合的组件，这正是Facebook推荐的现代化前端架构模式。## 为什么选择React Page组件化开发？ 🚀React Page提供了一个