gallery 是什么?

Google AI Edge Gallery 是 Google 官方推出的移动端应用,用于在手机本地运行开源大模型——完全离线、隐私、快速。它既是一个让普通用户「下载即用」体验各种端侧 GenAI 用例的画廊,也是一个灵活的沙箱,可下载或加载自定义模型、做基准测试,所有推理都在设备硬件上完成、无需联网。当前版本主打对新发布的 Gemma 4 系列的官方支持。许可为 Apache-2.0,Kotlin 编写(含 iOS 版),约 23,235 stars;可从 Google Play、App Store 或 GitHub release 的 APK 安装。

⭐ 20,714 Stars 🍴 1,956 Forks Kotlin 作者: google-ai-edge
来源:README.md(首段、Now Featuring Gemma 4、100% On-Device Privacy、安装方式);GitHub 仓库元数据(stars=23235、license=Apache-2.0、language=Kotlin) 查看 GitHub 仓库 →

为什么值得关注

端侧(on-device)GenAI 是当前热点——隐私、离线可用、低延迟、零推理成本是其核心吸引力。Google AI Edge Gallery 作为 Google 官方的端侧模型体验入口,覆盖聊天、视觉、语音、函数调用等多种用例,并第一时间支持 Gemma 4 与「思考模式」,让用户能在自己手机上直接试用前沿开源模型,因而获得高关注。截至数据采集约 23,235 stars。

来源:README.md(首段、Core Features、Now Featuring Gemma 4);GitHub 仓库元数据(stars=23235)

核心功能

Agent Skills 与思考模式

通过 Agent Skills 磁贴用工具增强模型(Wikipedia 事实校验、地图、摘要卡),可从 URL 加载模块化技能;AI 聊天支持 Thinking Mode 查看模型逐步推理(从 Gemma 4 系列起支持)。

来源:README.md(Core Features → Agent Skills、AI Chat with Thinking Mode)
多模态与语音

Ask Image 用摄像头或相册做物体识别、视觉解题与详细描述;Audio Scribe 用高效端侧模型实时转写并翻译语音。

来源:README.md(Core Features → Ask Image、Audio Scribe)
Prompt 实验室与端侧动作

Prompt Lab 提供对 temperature、top-k 等参数的精细控制做单轮用例测试;Mobile Actions 用 FunctionGemma 270m 微调实现离线设备控制与自动化任务。

来源:README.md(Core Features → Prompt Lab、Mobile Actions)
模型管理与基准 + 全程本地

可从列表下载或加载自定义模型、管理模型库并跑基准测试,了解各模型在你硬件上的表现;所有推理在设备本地完成,无需联网,保证隐私。

来源:README.md(Core Features → Model Management & Benchmark、100% On-Device Privacy)

技术架构

它是一个原生移动应用(Android Kotlin 为主,另有 iOS 版),底层基于 Google AI Edge 的端侧 ML API 与 LiteRT(轻量运行时)做模型优化执行,并集成 Hugging Face 做模型发现与下载。应用以「磁贴/用例」的形式组织各项能力(聊天、看图问答、语音转写、Prompt 实验室、移动端动作、模型管理与基准等),并提供 Agent Skills 机制——可从 URL 加载模块化技能或浏览社区贡献来增强模型能力(如用 Wikipedia 做事实校验、交互式地图、可视化摘要卡)。其中 Mobile Actions 和 Tiny Garden 小游戏由 FunctionGemma 270m 的微调驱动。所有模型推理都在设备本地进行。

来源:README.md(Technology Highlights、Core Features、100% On-Device Privacy)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) LiteRT(轻量端侧运行时)LiteRT(轻量端… Hugging Face(模型发现与下载,litert-community)Hugging Face(… Gemma 4 / FunctionGemma 270m 等开源模型Gemma 4 / Func… Agent Skills 与思考模式Agent Skills 与思考… 多模态与语音 Prompt 实验室与端侧动作Prompt 实验室与端侧动… 模型管理与基准 + 全程本地模型管理与基准 + 全程… gallery 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Kotlin(Android 为主),含 iOS 版本框架原生移动应用 + Google AI Edge 端侧 ML
LiteRT(轻量端侧运行时)Hugging Face(模型发现与下载,litert-community)Gemma 4 / FunctionGemma 270m 等开源模型
Google Play / App Store / GitHub release APK 分发;需 Android 12+ 或 iOS 17+
来源:README.md(Technology Highlights、Get Started、Useful Links);GitHub 仓库元数据(language=Kotlin)

快速上手

系统要求 Android 12 及以上或 iOS 17 及以上。从 Google Play 或 App Store 安装应用;无 Google Play 的用户可从 GitHub 的最新 release 安装 APK。装好后即可浏览各用例磁贴:下载或加载模型、开启 AI 聊天(可切换思考模式)、用 Ask Image 做看图问答、用 Audio Scribe 转写语音、在 Prompt Lab 调参测试等。详细安装(含企业设备)与完整使用指南见项目 Wiki。本地构建开发请参考 DEVELOPMENT.md。它目前是实验性 Beta 版本。
来源:README.md(Get Started in Minutes、Development、Feedback)

使用场景

适合想在手机上离线体验和评估开源大模型的用户与开发者:在通勤等无网环境做隐私敏感的 AI 聊天、看图问答、语音转写翻译;测试不同模型在自己设备上的性能与功耗(基准);用 Prompt Lab 调参做单轮用例验证;用 Agent Skills 给端侧模型加工具;以及第一时间试用 Gemma 4 的推理能力。对关注端侧推理、隐私优先和模型选型评估的人尤其有价值。它是体验/评估工具,并非面向生产部署的 SDK 本身。

来源:README.md(Core Features、首段定位、Feedback 的 Beta 说明)

优势与局限

优势

  • Google 官方出品,基于 LiteRT/AI Edge,端侧执行优化到位
  • 用例覆盖广(聊天/视觉/语音/函数调用/基准),且第一时间支持 Gemma 4
  • 100% 本地推理,隐私与离线可用是核心优势
  • 可下载或加载自定义模型并做硬件基准,灵活的端侧沙箱,Apache-2.0 开源

局限

  • 目前为实验性 Beta,功能与稳定性仍在演进
  • 端侧推理受手机算力/内存限制,大模型与长上下文表现受硬件约束
  • 部分能力(思考模式、移动端动作)依赖特定模型(Gemma 4 / FunctionGemma 270m)
  • 定位是体验/评估应用,而非可直接嵌入产品的开发框架
来源:README.md(Feedback 的 Beta 说明、Core Features、100% On-Device Privacy)

最新版本

当前版本主打对新发布的 Gemma 4 系列的官方支持——作为本次发布的核心,可在端侧测试 Gemma 4 的高级推理、逻辑与创作能力,并配合新增的「思考模式」查看其逐步推理(从 Gemma 4 系列起支持)。具体版本与变更见 GitHub releases。

来源:README.md(Now Featuring Gemma 4、AI Chat with Thinking Mode);GitHub releases 徽章

总结评价

Google AI Edge Gallery 是体验和评估端侧 GenAI 的一个权威入口:Google 官方出品、基于 LiteRT 优化、用例覆盖广、100% 本地推理保证隐私,并第一时间支持 Gemma 4 与思考模式。对想在手机上离线试用开源模型、或评估不同模型在自己硬件上表现的用户和开发者,它非常实用。要清楚它目前是实验性 Beta、受端侧算力约束、且定位是体验/评估应用而非生产 SDK。作为「把端侧 AI 装进口袋」的官方画廊,它的完成度与可信度都很高。

来源:综合 README.md 的官方背景、技术栈与用例覆盖
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 12:33. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件