Rerun(rerun-io/rerun)自定位为「physical AI 的数据层」,是面向多模态机器人/具身数据的记录、查询、可视化与流式训练工具。它能摄入多源、多速率、多模态数据(图像、点云、坐标变换、时间序列、关节状态、视频等),用内置 Viewer 实时同步渲染(可拖动时间轴、并排对比传感器、实时观察 CV 流水线),同一份数据可用 dataframe 或 SQL 查询并直接流入训练。底层用 Rust 构建、基于面向多速率物理数据的列式 chunk 存储,提供 Python/Rust/C++ SDK。双许可 MIT/Apache-2.0,约 10,825 stars,官网 rerun.io。
来源:README.md(标题、What it does、Data types、SDK);GitHub 仓库元数据(stars=10825、language=Rust、license=Apache-2.0) 查看 GitHub 仓库 →机器人/具身智能与多模态训练升温,痛点是异构传感器数据难以统一记录、对齐查看与喂入训练。Rerun 把记录、可视化、查询、流式训练统一在一份列式存储上,支持机器人日志、人采集设备、仿真、网络视频及 MCAP/rrd/LeRobot 等格式,且 `pip install rerun-sdk` 两分钟即可看到可视化,对机器人与 CV 团队很友好。其「直接流入训练、无导出无陈旧副本」是项目自述,实际取决于规模与管线。截至数据采集约 10,825 stars。
来源:README.md(What it does、Use cases、Quickstart);GitHub 仓库元数据(stars=10825、pushed_at 2026-05)摄入图像、点云、时间序列、张量、坐标变换、关节状态、视频等多速率多模态数据,端到端保留。
来源:README.md(What it does、Data types)内置查看器实时同步渲染,可拖动 episode 时间轴、并排对比传感器、实时观察 CV 流水线。
来源:README.md(What it does)同一份数据可用 dataframe 或 SQL 查询原始、中间与衍生结果,便于数据加工。
来源:README.md(What it does、Use cases)数据集组合可直接流入训练,无需导出作业与陈旧副本;多语言 SDK(Python/Rust/C++)。
来源:README.md(Use cases、SDK)Rerun 的核心是为多速率物理数据设计的列式 chunk 存储:用户通过 SDK 以「实体路径 + 时间轴」的方式 log 各类数据(如 rr.set_time 设定 frame 时间轴、rr.log 记录 Points3D 等),数据既可实时发送给 Viewer 渲染,也可 rr.save 落盘为 .rrd 或经 gRPC 连接远端 Viewer。Viewer 负责多模态同步可视化;同一份数据可用 dataframe/SQL 查询,并能把数据集组合直接流入训练。整体用 Rust 实现,对外提供 Python/Rust/C++ 三套 SDK,并有独立的 rerun Viewer 二进制用于网络流和加载 .rrd。
来源:README.md(What it does、A short taste 代码、Getting started、Viewer binary);GitHub 仓库元数据(language=Rust)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
列式 chunk 存储Rerun Viewer(独立二进制)支持 MCAP / rrd / LeRobot 等格式适合机器人、具身智能与多模态 CV 团队:把机器人日志、第一视角/UMI 采集、仿真与网络视频汇入统一基底;以「表编辑」方式运行 SLAM、手部追踪、动作重定向等 CV 流水线;用 dataframe/SQL 查询原始与衍生数据;跨管线可视化多速率多模态序列;并把数据集组合直接流入训练,免去导出与副本管理。也适合算法调试时实时观察传感器与中间结果。
来源:README.md(Use cases、Data types)本页未列具体版本号;Rerun 发布到 PyPI(rerun-sdk)与 crates.io(rerun),版本号见对应包页面与 GitHub Releases,更新涉及 Viewer、存储与 SDK 能力。仓库最后更新约在 2026 年 5 月,处于活跃迭代。
来源:README.md(PyPI/crates 徽章与链接);GitHub pushed_atRerun 是面向 physical AI 的多模态数据层:把机器人/具身数据的记录、实时同步可视化、dataframe/SQL 查询与流式训练统一在为多速率物理数据设计的列式存储上,提供 Python/Rust/C++ SDK 且安装即用,对机器人与多模态 CV 团队是很对口的基础设施。要清楚它聚焦物理/机器人数据而非通用业务数据、大规模性能需实测、概念模型有学习成本。作为该领域的数据与可视化基底,定位清晰、工程扎实。
来源:综合 README.md 的定位、能力、SDK 与适用场景