rerun 是什么?

Rerun(rerun-io/rerun)自定位为「physical AI 的数据层」,是面向多模态机器人/具身数据的记录、查询、可视化与流式训练工具。它能摄入多源、多速率、多模态数据(图像、点云、坐标变换、时间序列、关节状态、视频等),用内置 Viewer 实时同步渲染(可拖动时间轴、并排对比传感器、实时观察 CV 流水线),同一份数据可用 dataframe 或 SQL 查询并直接流入训练。底层用 Rust 构建、基于面向多速率物理数据的列式 chunk 存储,提供 Python/Rust/C++ SDK。双许可 MIT/Apache-2.0,约 10,825 stars,官网 rerun.io。

⭐ 10,483 Stars 🍴 705 Forks Rust Apache-2.0 作者: rerun-io
来源:README.md(标题、What it does、Data types、SDK);GitHub 仓库元数据(stars=10825、language=Rust、license=Apache-2.0) 查看 GitHub 仓库 →

为什么值得关注

机器人/具身智能与多模态训练升温,痛点是异构传感器数据难以统一记录、对齐查看与喂入训练。Rerun 把记录、可视化、查询、流式训练统一在一份列式存储上,支持机器人日志、人采集设备、仿真、网络视频及 MCAP/rrd/LeRobot 等格式,且 `pip install rerun-sdk` 两分钟即可看到可视化,对机器人与 CV 团队很友好。其「直接流入训练、无导出无陈旧副本」是项目自述,实际取决于规模与管线。截至数据采集约 10,825 stars。

来源:README.md(What it does、Use cases、Quickstart);GitHub 仓库元数据(stars=10825、pushed_at 2026-05)

核心功能

多模态数据记录

摄入图像、点云、时间序列、张量、坐标变换、关节状态、视频等多速率多模态数据,端到端保留。

来源:README.md(What it does、Data types)
实时同步 Viewer

内置查看器实时同步渲染,可拖动 episode 时间轴、并排对比传感器、实时观察 CV 流水线。

来源:README.md(What it does)
dataframe / SQL 查询

同一份数据可用 dataframe 或 SQL 查询原始、中间与衍生结果,便于数据加工。

来源:README.md(What it does、Use cases)
直接流式训练

数据集组合可直接流入训练,无需导出作业与陈旧副本;多语言 SDK(Python/Rust/C++)。

来源:README.md(Use cases、SDK)

技术架构

Rerun 的核心是为多速率物理数据设计的列式 chunk 存储:用户通过 SDK 以「实体路径 + 时间轴」的方式 log 各类数据(如 rr.set_time 设定 frame 时间轴、rr.log 记录 Points3D 等),数据既可实时发送给 Viewer 渲染,也可 rr.save 落盘为 .rrd 或经 gRPC 连接远端 Viewer。Viewer 负责多模态同步可视化;同一份数据可用 dataframe/SQL 查询,并能把数据集组合直接流入训练。整体用 Rust 实现,对外提供 Python/Rust/C++ 三套 SDK,并有独立的 rerun Viewer 二进制用于网络流和加载 .rrd。

来源:README.md(What it does、A short taste 代码、Getting started、Viewer binary);GitHub 仓库元数据(language=Rust)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) 列式 chunk 存储 Rerun Viewer(独立二进制)Rerun Viewer(… 支持 MCAP / rrd / LeRobot 等格式支持 MCAP / rr… 多模态数据记录 实时同步 Viewer dataframe / SQL 查询 直接流式训练 rerun 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Rust(核心)+ Python/C++ SDK框架面向多模态/多速率物理数据的列式存储 + 可视化 Viewer
列式 chunk 存储Rerun Viewer(独立二进制)支持 MCAP / rrd / LeRobot 等格式
PyPI rerun-sdk、crates.io rerun、conda;浏览器版 Viewer;双许可 MIT/Apache-2.0
来源:README.md(What it does、Getting started、徽章);GitHub 仓库元数据(language=Rust、license=Apache-2.0)

快速上手

Python:`pip install rerun-sdk`,在代码里 rr.init(...) 后用 rr.spawn() 拉起 Viewer,并以 rr.set_time 设定时间轴、rr.log(实体路径, 数据) 记录(如 Points3D),即可在 Viewer 中看到可视化;也可 rr.save 落盘 .rrd 或 rr.connect_grpc 连远端。Rust 用 `cargo add rerun`,C++ 见对应文档。要做网络流/加载 .rrd 需安装 rerun Viewer 二进制(随 rerun-sdk 提供或 cargo 安装)。官网 docs 有各语言 getting-started。
来源:README.md(Quickstart、A short taste、Getting started、Viewer binary)

使用场景

适合机器人、具身智能与多模态 CV 团队:把机器人日志、第一视角/UMI 采集、仿真与网络视频汇入统一基底;以「表编辑」方式运行 SLAM、手部追踪、动作重定向等 CV 流水线;用 dataframe/SQL 查询原始与衍生数据;跨管线可视化多速率多模态序列;并把数据集组合直接流入训练,免去导出与副本管理。也适合算法调试时实时观察传感器与中间结果。

来源:README.md(Use cases、Data types)

优势与局限

优势

  • 记录/可视化/查询/流式训练统一在一份列式存储上
  • 多模态多速率数据端到端保留,Viewer 实时同步
  • Python/Rust/C++ 多 SDK,安装即用、上手快
  • 支持 MCAP/rrd/LeRobot 等格式,契合机器人数据生态

局限

  • 聚焦物理/机器人多模态数据,通用业务数据并非目标
  • 大规模数据的存储与查询性能需按场景实测
  • Viewer 与列式存储的概念模型有学习成本
  • 「直接流入训练」的体验取决于具体训练管线整合
来源:README.md(What it does、Data types、Use cases)

最新版本

本页未列具体版本号;Rerun 发布到 PyPI(rerun-sdk)与 crates.io(rerun),版本号见对应包页面与 GitHub Releases,更新涉及 Viewer、存储与 SDK 能力。仓库最后更新约在 2026 年 5 月,处于活跃迭代。

来源:README.md(PyPI/crates 徽章与链接);GitHub pushed_at

总结评价

Rerun 是面向 physical AI 的多模态数据层:把机器人/具身数据的记录、实时同步可视化、dataframe/SQL 查询与流式训练统一在为多速率物理数据设计的列式存储上,提供 Python/Rust/C++ SDK 且安装即用,对机器人与多模态 CV 团队是很对口的基础设施。要清楚它聚焦物理/机器人数据而非通用业务数据、大规模性能需实测、概念模型有学习成本。作为该领域的数据与可视化基底,定位清晰、工程扎实。

来源:综合 README.md 的定位、能力、SDK 与适用场景
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 15:44. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件