gallery 深度解析：架构、场景与部署指南（20K★）

为什么值得关注

端侧（on-device）GenAI 是当前热点——隐私、离线可用、低延迟、零推理成本是其核心吸引力。Google AI Edge Gallery 作为 Google 官方的端侧模型体验入口，覆盖聊天、视觉、语音、函数调用等多种用例，并第一时间支持 Gemma 4 与「思考模式」，让用户能在自己手机上直接试用前沿开源模型，因而获得高关注。截至数据采集约 23,235 stars。

来源：README.md（首段、Core Features、Now Featuring Gemma 4）；GitHub 仓库元数据（stars=23235）

核心功能

Agent Skills 与思考模式

通过 Agent Skills 磁贴用工具增强模型（Wikipedia 事实校验、地图、摘要卡），可从 URL 加载模块化技能；AI 聊天支持 Thinking Mode 查看模型逐步推理（从 Gemma 4 系列起支持）。

来源：README.md（Core Features → Agent Skills、AI Chat with Thinking Mode）

多模态与语音

Ask Image 用摄像头或相册做物体识别、视觉解题与详细描述；Audio Scribe 用高效端侧模型实时转写并翻译语音。

来源：README.md（Core Features → Ask Image、Audio Scribe）

Prompt 实验室与端侧动作

Prompt Lab 提供对 temperature、top-k 等参数的精细控制做单轮用例测试；Mobile Actions 用 FunctionGemma 270m 微调实现离线设备控制与自动化任务。

来源：README.md（Core Features → Prompt Lab、Mobile Actions）

模型管理与基准 + 全程本地

可从列表下载或加载自定义模型、管理模型库并跑基准测试，了解各模型在你硬件上的表现；所有推理在设备本地完成，无需联网，保证隐私。

来源：README.md（Core Features → Model Management & Benchmark、100% On-Device Privacy）

技术架构

它是一个原生移动应用（Android Kotlin 为主，另有 iOS 版），底层基于 Google AI Edge 的端侧 ML API 与 LiteRT（轻量运行时）做模型优化执行，并集成 Hugging Face 做模型发现与下载。应用以「磁贴/用例」的形式组织各项能力（聊天、看图问答、语音转写、Prompt 实验室、移动端动作、模型管理与基准等），并提供 Agent Skills 机制——可从 URL 加载模块化技能或浏览社区贡献来增强模型能力（如用 Wikipedia 做事实校验、交互式地图、可视化摘要卡）。其中 Mobile Actions 和 Tiny Garden 小游戏由 FunctionGemma 270m 的微调驱动。所有模型推理都在设备本地进行。

来源：README.md（Technology Highlights、Core Features、100% On-Device Privacy）

项目知识图谱

中心为项目本体，内环 = 核心功能模块，外环 = 关键技术依赖；按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Kotlin（Android 为主），含 iOS 版本框架原生移动应用 + Google AI Edge 端侧 ML

关键依赖

LiteRT（轻量端侧运行时）Hugging Face（模型发现与下载，litert-community）Gemma 4 / FunctionGemma 270m 等开源模型

基础设施 / 部署

Google Play / App Store / GitHub release APK 分发；需 Android 12+ 或 iOS 17+

来源：README.md（Technology Highlights、Get Started、Useful Links）；GitHub 仓库元数据（language=Kotlin）

快速上手

系统要求 Android 12 及以上或 iOS 17 及以上。从 Google Play 或 App Store 安装应用；无 Google Play 的用户可从 GitHub 的最新 release 安装 APK。装好后即可浏览各用例磁贴：下载或加载模型、开启 AI 聊天（可切换思考模式）、用 Ask Image 做看图问答、用 Audio Scribe 转写语音、在 Prompt Lab 调参测试等。详细安装（含企业设备）与完整使用指南见项目 Wiki。本地构建开发请参考 DEVELOPMENT.md。它目前是实验性 Beta 版本。

来源：README.md（Get Started in Minutes、Development、Feedback）

使用场景

适合想在手机上离线体验和评估开源大模型的用户与开发者：在通勤等无网环境做隐私敏感的 AI 聊天、看图问答、语音转写翻译；测试不同模型在自己设备上的性能与功耗（基准）；用 Prompt Lab 调参做单轮用例验证；用 Agent Skills 给端侧模型加工具；以及第一时间试用 Gemma 4 的推理能力。对关注端侧推理、隐私优先和模型选型评估的人尤其有价值。它是体验/评估工具，并非面向生产部署的 SDK 本身。

来源：README.md（Core Features、首段定位、Feedback 的 Beta 说明）

优势与局限

优势

Google 官方出品，基于 LiteRT/AI Edge，端侧执行优化到位
用例覆盖广（聊天/视觉/语音/函数调用/基准），且第一时间支持 Gemma 4
100% 本地推理，隐私与离线可用是核心优势
可下载或加载自定义模型并做硬件基准，灵活的端侧沙箱，Apache-2.0 开源

局限

目前为实验性 Beta，功能与稳定性仍在演进
端侧推理受手机算力/内存限制，大模型与长上下文表现受硬件约束
部分能力（思考模式、移动端动作）依赖特定模型（Gemma 4 / FunctionGemma 270m）
定位是体验/评估应用，而非可直接嵌入产品的开发框架

来源：README.md（Feedback 的 Beta 说明、Core Features、100% On-Device Privacy）

总结评价

Google AI Edge Gallery 是体验和评估端侧 GenAI 的一个权威入口：Google 官方出品、基于 LiteRT 优化、用例覆盖广、100% 本地推理保证隐私，并第一时间支持 Gemma 4 与思考模式。对想在手机上离线试用开源模型、或评估不同模型在自己硬件上表现的用户和开发者，它非常实用。要清楚它目前是实验性 Beta、受端侧算力约束、且定位是体验/评估应用而非生产 SDK。作为「把端侧 AI 装进口袋」的官方画廊，它的完成度与可信度都很高。

来源：综合 README.md 的官方背景、技术栈与用例覆盖

常见问题

gallery 是什么？

Google AI Edge Gallery 是 Google 官方推出的移动端应用，用于在手机本地运行开源大模型——完全离线、隐私、快速。它既是一个让普通用户「下载即用」体验各种端侧 GenAI 用例的画廊，也是一个灵活的沙箱，可下载或加载自定义模型、做基准测试，所有推理都在设备硬件上完成、无需联网。当前版本主打对新发布的 Gemma 4 系列的官方支持。

gallery 有哪些核心功能？

gallery 的核心功能包括：Agent Skills 与思考模式、多模态与语音、Prompt 实验室与端侧动作、模型管理与基准 + 全程本地。

gallery 为什么最近很受关注？

gallery 适合哪些使用场景？

透明度声明
本页内容由 AI（大语言模型）基于以下公开材料自动生成：GitHub README、代码目录结构、依赖文件、Release 信息。分析时间: 2026-05-24 12:33. 质量评分: 100/100.

数据来源：README、GitHub API、依赖文件