image-blaster 是一套给 Claude(Claude Code)的「单张图像 → 3D 世界」skill 集合:用 Claude 编排 World Labs、FAL 等生成模型,从一张图 5 分钟内产出可探索的 Gaussian splat 静态环境(.spz)、所有动态物体的 3D 网格(.glb/.obj)以及环境与物体音效(.mp3),并可嵌入 Unity/Unreal/Godot、Blender/Maya 等 DCC 或 Three.js/Electron。
来源:README 首段 + Description + Extensions 查看 GitHub 仓库 →从一张概念图到能用的 3D 场景,传统要建模、贴图、做音效,跨多个工具耗时巨大。image-blaster 把这条链路用 Claude 当编排者一键串起来:图像清理(nano-banana / gpt-image-2)→ 静态环境生成可探索 Gaussian splat(World Labs Marble marble-1.1)→ 动态物体生成 3D 网格(Hunyuan-3D via FAL)→ 配环境与物体音效(ElevenLabs SFX),<5 分钟出活。它的巧处不在自研模型,而在把几个当红商业生成 API 用 Claude 的 skill 体系编排成一条「image-to-world」流水线,产物是游戏引擎/DCC/Web 直接可用的标准格式(.spz/.glb/.obj/.mp3),定位「3D 工作的起点加速器」(游戏关卡概念、影视场景勘景、机器人环境、建筑渲染都能 blast)。在「AI 一键生成 3D 世界」这个新兴方向上是个完成度高、即取即用的实现。
来源:README Description / 生成模型列表 / Examples用 World Labs 的 marble-1.1 模型把输入图变成可探索的环境,输出 Gaussian splat(.spz)作为静态场景。这是「世界」的主体——一个能在其中漫游的 3D 空间,而非单个模型。
来源:README 生成模型(marble-1.1)+ Description对图中的动态物体用 Hunyuan-3D(经 FAL)生成 .glb/.obj 网格。支持 Hunyuan 参数:--face-count(40000-1500000,默认 50000)、--enable-pbr(默认 true)、--generate-type(Normal 带贴图 / LowPoly 减面 / Geometry 纯白几何)、--polygon-type(triangle/quadrilateral)。
来源:README 生成模型 + 3D 参数列表生成前先做源图清理、clean plate、物体参考图:默认用 nano-banana 做图像编辑,也可让 edit skill 改用 gpt-image-2。把脏的输入图整理成适合后续 3D/环境生成的素材。
来源:README 生成模型(nano-banana / gpt-image-2)用 ElevenLabs SFX 模型生成环境 ambient 循环音和物体特定的物理 SFX(.mp3),让生成的 3D 世界不只是视觉,还带声音氛围。
来源:README 生成模型(elevenlabs-sfx)+ Description整个流程由 Claude(Claude Code)作为 skill 编排:把图放进 input/,让 Claude「blast it and confirm each step with me」即可分步执行并逐步确认。.claude/ 目录(59 文件)是这套 image-to-world 的 skill 定义,.cursor/ 也有适配。
来源:README Quickstart + tree(.claude/ 59 / .cursor/)产物是 .spz(splat)/.glb/.obj(网格)/.mp3(音效)标准格式,可嵌入 Unity/Unreal/Godot 游戏引擎、Blender/3DS Max/Maya 等 DCC、Three.js/Electron Web 应用。app/(106 文件)是内置的 React 查看器(从 .claudeignore 移除 /app 后 Claude 也能改它)。
来源:README Extensions / Development + app/ 目录image-blaster 本质是一套 Claude Code skillset + 一个 React 查看器,不是自研生成引擎。.claude/(59 文件)是核心——定义 image-to-world 流水线的各 skill(图像编辑、环境生成、3D 网格、音效),Claude 据此编排外部商业生成 API:World Labs(marble-1.1 出 Gaussian splat 环境)、FAL(Hunyuan-3D 出网格)、nano-banana/gpt-image-2(图像编辑)、ElevenLabs(SFX)。app/(106 文件,TypeScript + bun)是 React 查看器用来预览生成的 splat/网格。数据流:input/ 放图 → Claude 调 edit skill 清理图 → 调环境 skill 生成 splat → 对动态物体调 3D skill 出网格 → 调音效 skill 出 SFX → 产物落到 worlds/ → React 查看器预览或导出到游戏引擎/DCC。配置靠 .env(World Labs + FAL API key),bun 管依赖。设计判断:用 Claude 的 skill 体系做「多个生成 API 的编排器」、产物用标准 3D 格式以便下游引擎直接用,是个轻巧而聪明的取舍——它不承担模型训练,价值在把分散的 SOTA 生成能力串成 5 分钟出活的流水线;代价是整条链路强依赖多个第三方付费 API(World Labs/FAL/ElevenLabs),任何一家变更定价/接口/模型都会影响它,且生成质量完全由这些上游模型决定。
来源:tree(.claude/app/worlds)+ README 生成模型 + package.json中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
World Labs marble-1.1FAL + Hunyuan-3Dnano-banana / gpt-image-2ElevenLabs SFXReact + bun1. 游戏关卡概念:把一张概念图 blast 成可探索环境 + 物体网格,快速搭关卡原型导入 Unity/Unreal/Godot;2. 影视/勘景:把一张场景图变成 3D 空间做虚拟勘景或预演;3. 机器人/仿真环境:从图生成 3D 环境给机器人做仿真场景;4. 建筑渲染:把渲染图变成可漫游的 3D 世界;5. DCC 起点加速:在 Blender/Maya 里以生成的网格和环境为起点继续精修,省掉从零建模;6. Web 3D:把产物嵌进 Three.js/Electron 应用做交互式 3D 展示。
来源:README Examples / Extensions无 GitHub Release。仓库 2026-04-21 创建、pushed 到 2026-05-15,更新走主分支提交。版本/变更以 commit 历史为准。
来源:GitHub Releases API(0)+ repo created/pushed如果你做 3D(游戏关卡、影视勘景、建筑、机器人仿真)想要一个快速起点,image-blaster 把「单图 → 可探索 3D 世界 + 物体网格 + 音效」做成 Claude 一键编排的 5 分钟流水线,产物还是引擎直接可用的标准格式。务实建议:1) 它是「起点加速器」不是成品生成——产物(splat/网格)通常要回 DCC 清理、重拓扑、对比例才能用于生产,按 jumpstart 用;2) 强依赖 World Labs + FAL(+ ElevenLabs/图像 API)多家付费服务,先备好 API key 并清楚每次 blast 会产生多家费用;3) 质量由上游模型决定,复杂图像效果不可控,先用简单清晰的图试;4) 生成不确定、难复现,重要资产要多 blast 几次挑最好的;5) 想控网格质量就调 Hunyuan 参数(face-count/PBR/generate-type);6) 无 release、模型名硬编码,上游模型迭代时留意 skill 是否需更新。
来源:综合分析