image-blaster 是什么?

image-blaster 是一套给 Claude(Claude Code)的「单张图像 → 3D 世界」skill 集合:用 Claude 编排 World Labs、FAL 等生成模型,从一张图 5 分钟内产出可探索的 Gaussian splat 静态环境(.spz)、所有动态物体的 3D 网格(.glb/.obj)以及环境与物体音效(.mp3),并可嵌入 Unity/Unreal/Godot、Blender/Maya 等 DCC 或 Three.js/Electron。

⭐ 3,997 Stars 🍴 397 Forks TypeScript MIT 作者: neilsonnn
来源:README 首段 + Description + Extensions 查看 GitHub 仓库 →

为什么值得关注

从一张概念图到能用的 3D 场景,传统要建模、贴图、做音效,跨多个工具耗时巨大。image-blaster 把这条链路用 Claude 当编排者一键串起来:图像清理(nano-banana / gpt-image-2)→ 静态环境生成可探索 Gaussian splat(World Labs Marble marble-1.1)→ 动态物体生成 3D 网格(Hunyuan-3D via FAL)→ 配环境与物体音效(ElevenLabs SFX),<5 分钟出活。它的巧处不在自研模型,而在把几个当红商业生成 API 用 Claude 的 skill 体系编排成一条「image-to-world」流水线,产物是游戏引擎/DCC/Web 直接可用的标准格式(.spz/.glb/.obj/.mp3),定位「3D 工作的起点加速器」(游戏关卡概念、影视场景勘景、机器人环境、建筑渲染都能 blast)。在「AI 一键生成 3D 世界」这个新兴方向上是个完成度高、即取即用的实现。

来源:README Description / 生成模型列表 / Examples

核心功能

单图 → 可探索 3D 环境(World Labs Marble)

用 World Labs 的 marble-1.1 模型把输入图变成可探索的环境,输出 Gaussian splat(.spz)作为静态场景。这是「世界」的主体——一个能在其中漫游的 3D 空间,而非单个模型。

来源:README 生成模型(marble-1.1)+ Description
动态物体 3D 网格(Hunyuan-3D via FAL)

对图中的动态物体用 Hunyuan-3D(经 FAL)生成 .glb/.obj 网格。支持 Hunyuan 参数:--face-count(40000-1500000,默认 50000)、--enable-pbr(默认 true)、--generate-type(Normal 带贴图 / LowPoly 减面 / Geometry 纯白几何)、--polygon-type(triangle/quadrilateral)。

来源:README 生成模型 + 3D 参数列表
图像编辑预处理(nano-banana / gpt-image-2)

生成前先做源图清理、clean plate、物体参考图:默认用 nano-banana 做图像编辑,也可让 edit skill 改用 gpt-image-2。把脏的输入图整理成适合后续 3D/环境生成的素材。

来源:README 生成模型(nano-banana / gpt-image-2)
音效生成(ElevenLabs SFX)

用 ElevenLabs SFX 模型生成环境 ambient 循环音和物体特定的物理 SFX(.mp3),让生成的 3D 世界不只是视觉,还带声音氛围。

来源:README 生成模型(elevenlabs-sfx)+ Description
Claude 编排 + 分步确认

整个流程由 Claude(Claude Code)作为 skill 编排:把图放进 input/,让 Claude「blast it and confirm each step with me」即可分步执行并逐步确认。.claude/ 目录(59 文件)是这套 image-to-world 的 skill 定义,.cursor/ 也有适配。

来源:README Quickstart + tree(.claude/ 59 / .cursor/)
标准格式产物 + 多引擎嵌入 + React 查看器

产物是 .spz(splat)/.glb/.obj(网格)/.mp3(音效)标准格式,可嵌入 Unity/Unreal/Godot 游戏引擎、Blender/3DS Max/Maya 等 DCC、Three.js/Electron Web 应用。app/(106 文件)是内置的 React 查看器(从 .claudeignore 移除 /app 后 Claude 也能改它)。

来源:README Extensions / Development + app/ 目录

技术架构

image-blaster 本质是一套 Claude Code skillset + 一个 React 查看器,不是自研生成引擎。.claude/(59 文件)是核心——定义 image-to-world 流水线的各 skill(图像编辑、环境生成、3D 网格、音效),Claude 据此编排外部商业生成 API:World Labs(marble-1.1 出 Gaussian splat 环境)、FAL(Hunyuan-3D 出网格)、nano-banana/gpt-image-2(图像编辑)、ElevenLabs(SFX)。app/(106 文件,TypeScript + bun)是 React 查看器用来预览生成的 splat/网格。数据流:input/ 放图 → Claude 调 edit skill 清理图 → 调环境 skill 生成 splat → 对动态物体调 3D skill 出网格 → 调音效 skill 出 SFX → 产物落到 worlds/ → React 查看器预览或导出到游戏引擎/DCC。配置靠 .env(World Labs + FAL API key),bun 管依赖。设计判断:用 Claude 的 skill 体系做「多个生成 API 的编排器」、产物用标准 3D 格式以便下游引擎直接用,是个轻巧而聪明的取舍——它不承担模型训练,价值在把分散的 SOTA 生成能力串成 5 分钟出活的流水线;代价是整条链路强依赖多个第三方付费 API(World Labs/FAL/ElevenLabs),任何一家变更定价/接口/模型都会影响它,且生成质量完全由这些上游模型决定。

来源:tree(.claude/app/worlds)+ README 生成模型 + package.json

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) World Labs marble-1.1 — 可探索环境 / Gaussian splat(.spz)World Labs mar… FAL + Hunyuan-3D — 动态物体 3D 网格(.glb/.obj)FAL + Hunyuan-… nano-banana / gpt-image-2 — 图像编辑预处理nano-banana /… ElevenLabs SFX — 环境与物体音效(.mp3)ElevenLabs SFX React + bun — 查看器 app/React + bun 单图 → 可探索 3D 环境(World Labs Marble)单图 → 可探索 3D 环… 动态物体 3D 网格(Hunyuan-3D via FAL)动态物体 3D 网格(Hun… 图像编辑预处理(nano-banana / gpt-image-2)图像编辑预处理(nano-… 音效生成(ElevenLabs SFX)音效生成(ElevenLabs… Claude 编排 + 分步确认 标准格式产物 + 多引擎嵌入 + React 查看器标准格式产物 + 多引擎… image-blaster 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言TypeScript(React 查看器 + skill 辅助)框架Claude Code skill 集合 + React 查看器(bun 运行时)
World Labs marble-1.1FAL + Hunyuan-3Dnano-banana / gpt-image-2ElevenLabs SFXReact + bun
本地跑 Claude Code(claude)驱动,git clone 后把图放 input/;需 World Labs + FAL API key(.env),ElevenLabs 等按需;产物 .spz/.glb/.obj/.mp3 可导入 Unity/Unreal/Godot/Blender/Maya/Three.js;MIT 协议;无 release(持续更新)
来源:package.json + README Quickstart / 生成模型 + tree

快速上手

# 1. 克隆 git clone https://github.com/neilsonnn/image-blaster cd image-blaster # 2. 安装并运行 Claude Code curl -fsSL https://claude.ai/install.sh | bash claude # 3. 跟 Claude 打招呼,给它 World Labs 和 FAL 的 API key # World Labs: https://platform.worldlabs.ai/ FAL: https://fal.ai/ # 4. 把一张图放进 input/ 目录,然后让 Claude: # "blast it and confirm each step with me"(逐步确认执行) # 默认产出:动态物体 .glb/.obj 网格 + 静态环境 .spz Gaussian splat + ambient/物理 SFX .mp3 # 3D 网格可调 Hunyuan 参数: # --face-count <40000-1500000>(默认 50000) # --enable-pbr true|false(默认 true) # --generate-type Normal|LowPoly|Geometry # --polygon-type triangle|quadrilateral # 开发:从 .claudeignore 移除 /app 可让 Claude 改 React 查看器
来源:README Quickstart / Advanced / Development 原文

使用场景

1. 游戏关卡概念:把一张概念图 blast 成可探索环境 + 物体网格,快速搭关卡原型导入 Unity/Unreal/Godot;2. 影视/勘景:把一张场景图变成 3D 空间做虚拟勘景或预演;3. 机器人/仿真环境:从图生成 3D 环境给机器人做仿真场景;4. 建筑渲染:把渲染图变成可漫游的 3D 世界;5. DCC 起点加速:在 Blender/Maya 里以生成的网格和环境为起点继续精修,省掉从零建模;6. Web 3D:把产物嵌进 Three.js/Electron 应用做交互式 3D 展示。

来源:README Examples / Extensions

优势与局限

优势

  • 把分散的 SOTA 生成能力串成一条 5 分钟流水线:图像编辑→可探索环境→3D 网格→音效,Claude 当编排者,省掉手动跨多个工具/API
  • 产物即标准格式:.spz(splat)/.glb/.obj(网格)/.mp3 可直接进 Unity/Unreal/Godot/Blender/Maya/Three.js,是「3D 工作的起点」而非孤立 demo
  • 静态+动态分治合理:用 World Labs Marble 出可探索环境 splat、用 Hunyuan-3D 出动态物体网格,分别用各自最擅长的模型,还带 ambient/物理音效补全氛围
  • 上手极低:git clone + claude + 给两个 API key + 放图说 blast,分步确认执行;可调 Hunyuan 的 face-count/PBR/generate-type 等参数控制网格质量
  • 轻巧可嵌入:自身是 skillset + React 查看器,不重;MIT 协议,可嵌进任意游戏引擎/DCC/Web 的资产流程

局限

  • 强依赖多个第三方付费 API:World Labs(环境)+ FAL/Hunyuan-3D(网格)+ nano-banana/gpt-image-2(图像)+ ElevenLabs(音效),任一家变更定价/接口/模型都会影响整条链路,且每次 blast 都产生多家 API 费用
  • 质量完全由上游模型决定:生成的环境/网格/音效质量取决于 Marble、Hunyuan-3D 等模型本身,image-blaster 不能改善其上限;复杂/非常规图像的生成效果不可控
  • 可测试性 / 一致性风险:生成式 3D 的产出本质不确定、难复现,同一张图多次 blast 结果可能不同;无 benchmark 或质量评估,产物可用性需逐次人工判断
  • 可维护性风险:模型名硬编码在 skill 里(marble-1.1/hunyuan-3d/gpt-image-2 等),上游出新版或弃用需跟进改 skill;无 release、单作者项目,长期维护与版本管理待观察
  • 产物后处理成本:生成的网格/splat 往往需要在 DCC 里清理、重拓扑、对齐比例才能真正用于生产,「5 分钟出活」是起点不是成品,README 也定位为 jumpstart
  • 成本/性能未量化:单次 blast 调用多家生成 API 的总耗时与费用未给出,face-count 拉高(最高 150 万面)时的生成时间和成本会显著增加
来源:综合 README + tree + package.json + 生成式 3D 常识

最新版本

无 GitHub Release。仓库 2026-04-21 创建、pushed 到 2026-05-15,更新走主分支提交。版本/变更以 commit 历史为准。

来源:GitHub Releases API(0)+ repo created/pushed

总结评价

如果你做 3D(游戏关卡、影视勘景、建筑、机器人仿真)想要一个快速起点,image-blaster 把「单图 → 可探索 3D 世界 + 物体网格 + 音效」做成 Claude 一键编排的 5 分钟流水线,产物还是引擎直接可用的标准格式。务实建议:1) 它是「起点加速器」不是成品生成——产物(splat/网格)通常要回 DCC 清理、重拓扑、对比例才能用于生产,按 jumpstart 用;2) 强依赖 World Labs + FAL(+ ElevenLabs/图像 API)多家付费服务,先备好 API key 并清楚每次 blast 会产生多家费用;3) 质量由上游模型决定,复杂图像效果不可控,先用简单清晰的图试;4) 生成不确定、难复现,重要资产要多 blast 几次挑最好的;5) 想控网格质量就调 Hunyuan 参数(face-count/PBR/generate-type);6) 无 release、模型名硬编码,上游模型迭代时留意 skill 是否需更新。

来源:综合分析
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-22 10:32. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件