image-blaster 深度解析：架构、场景与部署指南（3K★）

为什么值得关注

从一张概念图到能用的 3D 场景，传统要建模、贴图、做音效，跨多个工具耗时巨大。image-blaster 把这条链路用 Claude 当编排者一键串起来：图像清理（nano-banana / gpt-image-2）→ 静态环境生成可探索 Gaussian splat（World Labs Marble marble-1.1）→ 动态物体生成 3D 网格（Hunyuan-3D via FAL）→ 配环境与物体音效（ElevenLabs SFX），<5 分钟出活。它的巧处不在自研模型，而在把几个当红商业生成 API 用 Claude 的 skill 体系编排成一条「image-to-world」流水线，产物是游戏引擎/DCC/Web 直接可用的标准格式（.spz/.glb/.obj/.mp3），定位「3D 工作的起点加速器」（游戏关卡概念、影视场景勘景、机器人环境、建筑渲染都能 blast）。在「AI 一键生成 3D 世界」这个新兴方向上是个完成度高、即取即用的实现。

来源：README Description / 生成模型列表 / Examples

核心功能

单图 → 可探索 3D 环境（World Labs Marble）

用 World Labs 的 marble-1.1 模型把输入图变成可探索的环境，输出 Gaussian splat（.spz）作为静态场景。这是「世界」的主体——一个能在其中漫游的 3D 空间，而非单个模型。

来源：README 生成模型（marble-1.1）+ Description

动态物体 3D 网格（Hunyuan-3D via FAL）

对图中的动态物体用 Hunyuan-3D（经 FAL）生成 .glb/.obj 网格。支持 Hunyuan 参数：--face-count（40000-1500000，默认 50000）、--enable-pbr（默认 true）、--generate-type（Normal 带贴图 / LowPoly 减面 / Geometry 纯白几何）、--polygon-type（triangle/quadrilateral）。

来源：README 生成模型 + 3D 参数列表

图像编辑预处理（nano-banana / gpt-image-2）

生成前先做源图清理、clean plate、物体参考图：默认用 nano-banana 做图像编辑，也可让 edit skill 改用 gpt-image-2。把脏的输入图整理成适合后续 3D/环境生成的素材。

来源：README 生成模型（nano-banana / gpt-image-2）

音效生成（ElevenLabs SFX）

用 ElevenLabs SFX 模型生成环境 ambient 循环音和物体特定的物理 SFX（.mp3），让生成的 3D 世界不只是视觉，还带声音氛围。

来源：README 生成模型（elevenlabs-sfx）+ Description

Claude 编排 + 分步确认

整个流程由 Claude（Claude Code）作为 skill 编排：把图放进 input/，让 Claude「blast it and confirm each step with me」即可分步执行并逐步确认。.claude/ 目录（59 文件）是这套 image-to-world 的 skill 定义，.cursor/ 也有适配。

来源：README Quickstart + tree（.claude/ 59 / .cursor/）

标准格式产物 + 多引擎嵌入 + React 查看器

产物是 .spz（splat）/.glb/.obj（网格）/.mp3（音效）标准格式，可嵌入 Unity/Unreal/Godot 游戏引擎、Blender/3DS Max/Maya 等 DCC、Three.js/Electron Web 应用。app/（106 文件）是内置的 React 查看器（从 .claudeignore 移除 /app 后 Claude 也能改它）。

来源：README Extensions / Development + app/ 目录

技术架构

image-blaster 本质是一套 Claude Code skillset + 一个 React 查看器，不是自研生成引擎。.claude/（59 文件）是核心——定义 image-to-world 流水线的各 skill（图像编辑、环境生成、3D 网格、音效），Claude 据此编排外部商业生成 API：World Labs（marble-1.1 出 Gaussian splat 环境）、FAL（Hunyuan-3D 出网格）、nano-banana/gpt-image-2（图像编辑）、ElevenLabs（SFX）。app/（106 文件，TypeScript + bun）是 React 查看器用来预览生成的 splat/网格。数据流：input/ 放图 → Claude 调 edit skill 清理图 → 调环境 skill 生成 splat → 对动态物体调 3D skill 出网格 → 调音效 skill 出 SFX → 产物落到 worlds/ → React 查看器预览或导出到游戏引擎/DCC。配置靠 .env（World Labs + FAL API key），bun 管依赖。设计判断：用 Claude 的 skill 体系做「多个生成 API 的编排器」、产物用标准 3D 格式以便下游引擎直接用，是个轻巧而聪明的取舍——它不承担模型训练，价值在把分散的 SOTA 生成能力串成 5 分钟出活的流水线；代价是整条链路强依赖多个第三方付费 API（World Labs/FAL/ElevenLabs），任何一家变更定价/接口/模型都会影响它，且生成质量完全由这些上游模型决定。

来源：tree（.claude/app/worlds）+ README 生成模型 + package.json

项目知识图谱

中心为项目本体，内环 = 核心功能模块，外环 = 关键技术依赖；按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言TypeScript（React 查看器 + skill 辅助）框架Claude Code skill 集合 + React 查看器（bun 运行时）

关键依赖

World Labs marble-1.1FAL + Hunyuan-3Dnano-banana / gpt-image-2ElevenLabs SFXReact + bun

基础设施 / 部署

本地跑 Claude Code（claude）驱动，git clone 后把图放 input/；需 World Labs + FAL API key（.env），ElevenLabs 等按需；产物 .spz/.glb/.obj/.mp3 可导入 Unity/Unreal/Godot/Blender/Maya/Three.js；MIT 协议；无 release（持续更新）

来源：package.json + README Quickstart / 生成模型 + tree

快速上手

# 1. 克隆 git clone https://github.com/neilsonnn/image-blaster cd image-blaster # 2. 安装并运行 Claude Code curl -fsSL https://claude.ai/install.sh | bash claude # 3. 跟 Claude 打招呼，给它 World Labs 和 FAL 的 API key # World Labs: https://platform.worldlabs.ai/ FAL: https://fal.ai/ # 4. 把一张图放进 input/ 目录，然后让 Claude： # "blast it and confirm each step with me"（逐步确认执行） # 默认产出：动态物体 .glb/.obj 网格 + 静态环境 .spz Gaussian splat + ambient/物理 SFX .mp3 # 3D 网格可调 Hunyuan 参数： # --face-count <40000-1500000>（默认 50000） # --enable-pbr true|false（默认 true） # --generate-type Normal|LowPoly|Geometry # --polygon-type triangle|quadrilateral # 开发：从 .claudeignore 移除 /app 可让 Claude 改 React 查看器

来源：README Quickstart / Advanced / Development 原文

使用场景

1. 游戏关卡概念：把一张概念图 blast 成可探索环境 + 物体网格，快速搭关卡原型导入 Unity/Unreal/Godot；2. 影视/勘景：把一张场景图变成 3D 空间做虚拟勘景或预演；3. 机器人/仿真环境：从图生成 3D 环境给机器人做仿真场景；4. 建筑渲染：把渲染图变成可漫游的 3D 世界；5. DCC 起点加速：在 Blender/Maya 里以生成的网格和环境为起点继续精修，省掉从零建模；6. Web 3D：把产物嵌进 Three.js/Electron 应用做交互式 3D 展示。

来源：README Examples / Extensions

优势与局限

优势

把分散的 SOTA 生成能力串成一条 5 分钟流水线：图像编辑→可探索环境→3D 网格→音效，Claude 当编排者，省掉手动跨多个工具/API
产物即标准格式：.spz（splat）/.glb/.obj（网格）/.mp3 可直接进 Unity/Unreal/Godot/Blender/Maya/Three.js，是「3D 工作的起点」而非孤立 demo
静态+动态分治合理：用 World Labs Marble 出可探索环境 splat、用 Hunyuan-3D 出动态物体网格，分别用各自最擅长的模型，还带 ambient/物理音效补全氛围
上手极低：git clone + claude + 给两个 API key + 放图说 blast，分步确认执行；可调 Hunyuan 的 face-count/PBR/generate-type 等参数控制网格质量
轻巧可嵌入：自身是 skillset + React 查看器，不重；MIT 协议，可嵌进任意游戏引擎/DCC/Web 的资产流程

局限

强依赖多个第三方付费 API：World Labs（环境）+ FAL/Hunyuan-3D（网格）+ nano-banana/gpt-image-2（图像）+ ElevenLabs（音效），任一家变更定价/接口/模型都会影响整条链路，且每次 blast 都产生多家 API 费用
质量完全由上游模型决定：生成的环境/网格/音效质量取决于 Marble、Hunyuan-3D 等模型本身，image-blaster 不能改善其上限；复杂/非常规图像的生成效果不可控
可测试性 / 一致性风险：生成式 3D 的产出本质不确定、难复现，同一张图多次 blast 结果可能不同；无 benchmark 或质量评估，产物可用性需逐次人工判断
可维护性风险：模型名硬编码在 skill 里（marble-1.1/hunyuan-3d/gpt-image-2 等），上游出新版或弃用需跟进改 skill；无 release、单作者项目，长期维护与版本管理待观察
产物后处理成本：生成的网格/splat 往往需要在 DCC 里清理、重拓扑、对齐比例才能真正用于生产，「5 分钟出活」是起点不是成品，README 也定位为 jumpstart
成本/性能未量化：单次 blast 调用多家生成 API 的总耗时与费用未给出，face-count 拉高（最高 150 万面）时的生成时间和成本会显著增加

来源：综合 README + tree + package.json + 生成式 3D 常识

总结评价

如果你做 3D（游戏关卡、影视勘景、建筑、机器人仿真）想要一个快速起点，image-blaster 把「单图 → 可探索 3D 世界 + 物体网格 + 音效」做成 Claude 一键编排的 5 分钟流水线，产物还是引擎直接可用的标准格式。务实建议：1) 它是「起点加速器」不是成品生成——产物（splat/网格）通常要回 DCC 清理、重拓扑、对比例才能用于生产，按 jumpstart 用；2) 强依赖 World Labs + FAL（+ ElevenLabs/图像 API）多家付费服务，先备好 API key 并清楚每次 blast 会产生多家费用；3) 质量由上游模型决定，复杂图像效果不可控，先用简单清晰的图试；4) 生成不确定、难复现，重要资产要多 blast 几次挑最好的；5) 想控网格质量就调 Hunyuan 参数（face-count/PBR/generate-type）；6) 无 release、模型名硬编码，上游模型迭代时留意 skill 是否需更新。

来源：综合分析

常见问题

image-blaster 是什么？

image-blaster 是一套给 Claude（Claude Code）的「单张图像 → 3D 世界」skill 集合：用 Claude 编排 World Labs、FAL 等生成模型，从一张图 5 分钟内产出可探索的 Gaussian splat 静态环境（.spz）、所有动态物体的 3D 网格（.glb/.obj）以及环境与物体音效（.mp3），并可嵌入 Unity/Unreal/Godot、Blender/Maya 等…

image-blaster 有哪些核心功能？

image-blaster 的核心功能包括：单图 → 可探索 3D 环境（World Labs Marble）、动态物体 3D 网格（Hunyuan-3D via FAL）、图像编辑预处理（nano-banana / gpt-image-2）、音效生成（ElevenLabs SFX）、Claude 编排 + 分步确认。

image-blaster 为什么最近很受关注？

image-blaster 适合哪些使用场景？

透明度声明
本页内容由 AI（大语言模型）基于以下公开材料自动生成：GitHub README、代码目录结构、依赖文件、Release 信息。分析时间: 2026-05-22 10:32. 质量评分: 100/100.

数据来源：README、GitHub API、依赖文件