CARLA-Air 是什么?统一驾驶 + 无人机的开源仿真平台

arXiv:2603.28032 2026-03-30 发布 👍 302 upvotes(W14 第一) GitHub: louiszengCN/CarlaAir 18 种传感器

CARLA-Air 是 2026 年 3 月发布的开源仿真平台,在单个虚幻引擎(Unreal Engine)进程里同时支持高保真城市驾驶仿真和多旋翼无人机飞行。它继承了已被官方存档的 AirSim 航空能力,提供 18 种传感器模态同步捕获,是面向"低空经济 + 具身智能"的基础设施级工作。HuggingFace 上获 302 票,是 2026 年 W14 周的最热论文。

为什么这篇论文值得关注

过去十年,地面驾驶仿真(CARLA)和无人机飞行仿真(AirSim)是两条独立的开源主线。CARLA 服务自动驾驶研究、AirSim 服务无人机和机器人研究,两者基于不同的虚幻引擎版本、不同的 API、不同的传感器规范。

2022 年微软宣布停止维护 AirSim,无人机研究社区一直在寻找替代方案。CARLA-Air 给出的答案不是"做一个新的无人机仿真器",而是把无人机能力整合进 CARLA 生态——继承 AirSim 已经验证的航空动力学模型,同时享受 CARLA 的高保真城市环境、规范的交通行为模型、丰富的传感器栈。

这个工作的意义远超 demo——它给"低空经济"(无人机物流、城市空中交通、UAM)、"空地协同"(无人机+地面机器人/车辆联动)、"具身 VLA 训练数据"等方向提供了基础设施级支持。在 HuggingFace 拿到 302 票,是 W14 周热度最高的论文。

核心能力

能力 1 / 统一仿真

单个 Unreal Engine 进程内同时模拟驾驶 + 飞行

传统做法是分别启动 CARLA(地面)和 AirSim(空中)两个进程,再通过 ROS / 自定义 bridge 同步——延迟高、状态不一致、调试困难。CARLA-Air 把多旋翼无人机集成进单个 CARLA 实例,所有 Agent 共享同一时间步、同一物理世界、同一渲染管线。

能力 2 / 18 种传感器同步

跨平台的多模态传感器同步捕获

支持 18 种传感器模态同步捕获——RGB 相机、深度图、语义分割、激光雷达、毫米波雷达、IMU、GPS、事件相机等。"跨平台"意味着可以在同一时间步给地面车辆和无人机分别配置不同传感器组合,并保证它们的输出严格同步——这对训练多模态感知模型至关重要。

能力 3 / 物理正确性

规范交通行为 + 符合空气动力学的无人机动力学

地面侧:保留 CARLA 原生的交通流(行人、车辆 AI、信号灯)和规范驾驶行为;空中侧:继承 AirSim 验证过的空气动力学模型(旋翼推力、姿态控制、风扰动)。这意味着 CARLA-Air 不是"在 CARLA 里贴一个会飞的盒子",而是真正物理正确的多旋翼仿真。

支持的任务场景

与现有无人机仿真器的关系

仿真器地面+空中维护状态城市环境保真度
CARLA-Air(本文)原生统一活跃,开源CARLA 级城市
AirSim只空中已存档(微软停止维护)受限
CARLA(原版)只地面活跃
Isaac Sim都支持但分开活跃(NVIDIA)需手动搭建
Gazebo都支持但分开活跃

CARLA-Air 的差异化点是"用 CARLA 已有的城市环境 + AirSim 已有的飞行能力"——把两条最强的开源线在一个进程内合体,而不是从零再造一个仿真器。

它能用来做什么

当前局限

1. 计算开销大。 单进程跑 CARLA 城市环境 + 多个无人机 + 18 种传感器,对 GPU 显存和算力要求高,普通工作站很难支持大规模并行训练。

2. 当前主要面向多旋翼。 abstract 主打多旋翼飞行能力,固定翼飞机、垂直起降等其他飞行器形态支持情况未明确说明。

3. 不替代真实飞行测试。 仿真训练后的策略仍需经过真实硬件验证,sim-to-real gap 在低空高动态场景下仍是开放问题。

4. CARLA 城市覆盖范围仍有限。 内置的 CARLA Town 系列地图主要是欧美城市风格,对中国式城市(密集建筑、复杂交通)的覆盖待扩展。

作者与机构

论文 4 位作者:Tianle Zeng(曾天乐)、Hanxuan Chen、Yanci Wen、Hong Zhang。论文 abstract 未明确列出作者机构归属(需查 PDF 全文)。GitHub 维护者 ID 是 louiszengCN,与第一作者匹配。

资源链接

总结评价

CARLA-Air 的价值不是"做了一个新仿真器",而是在 AirSim 停止维护后,给整个无人机+城市仿真研究社区提供了一条延续的开源路径

对自动驾驶 / 无人机研究者:你不再需要在两个仿真器之间切换,可以一份代码同时管空中和地面的 Agent。对低空经济产业:你有了一个公开可用、可定制的城市级仿真平台,不必再每家公司自己重复搭建。对具身 AI 研究:你拥有了多模态、多视角、多 Agent 的训练数据来源。

未来 6-12 个月值得观察的是:CARLA-Air 是否能像 CARLA 当年那样积累活跃的社区贡献(地图、车辆、传感器扩展),决定它能不能真正接住 AirSim 离场后留下的位置。

关于本页:本文是恩筑 AI 研究团队对 CARLA-Air 论文(arXiv:2603.28032v1)的中文深度解读,基于论文 abstract 和 GitHub README 公开信息撰写。事实性陈述可追溯到 arXiv 和 GitHub,定性判断代表团队观点。如有事实错误欢迎反馈到 contact@ngjoo.com