具身智能的
生成式基础设施

我们通过构建无限的高保真合成世界和统一的多模态大脑,重新定义自主智能系统的学习方式。

核心支柱 I

生成式世界模型

利用生成式 AI 构建数据反馈闭环框架。这创造了大规模的仿真场景,包含复杂的高层规则(如物理交互、因果逻辑)和完整的 3D Ground Truth。

  • ✓ 静态世界构建 (BEVControl)
  • ✓ 动态视频合成 (Unleashing)
  • ✓ 闭环自校正机制
Generative World Simulation

精选研究成果

BEVControl

ICCV 2023

从鸟瞰图草图精确生成 3D 场景几何,实现可控的自动驾驶与机器人仿真环境构建。

OmniGen

Generative AI

通过共享的 BEV 空间统一生成多模态传感器数据,确保跨相机和 LiDAR 的时空一致性。

DriveMRP

Safety Prediction

利用合成数据增强的大语言模型,预测规划轨迹的潜在风险,提升具身智能的安全性。

DualToken

Visual Tokenizer

用于理解和生成的统一视觉 Tokenizer,在 MLLM 任务中实现了最先进的性能。