Gemma

谷歌轻量级开源AI模型

从智能手机到服务器都能跑，支持多模态，Apache 2.0商用无门槛

访问官网 AI工具导航

核心功能

多参数版本选择

提供1B、2B、4B、9B、12B、27B、26B、31B等多种规模，适配边缘计算、端侧设备到服务器集群
多模态理解

Gemma 3及后续版本支持文本与图像联合输入，在问答、摘要、推理等任务中表现优异
超长上下文窗口

最大支持128K token上下文（约一部中篇小说的体量），是Gemma 2的16倍
140+语言原生支持

涵盖全球主要语种，真正实现开箱即用的跨语言能力
多框架无缝集成

官方原生支持JAX、PyTorch、TensorFlow，Hugging Face一键加载，Keras 3统一API
本地化高效部署

2B模型仅需约2GB显存（INT4量化），可在普通笔记本CPU和智能手机上运行

产品特色

01

Gemini同源技术，轻量不失水准

Gemma团队直接复用Gemini模型的架构设计和训练数据配方，从底层的模型架构、注意力机制到训练基础设施一脉相承，以轻量化的体积承载接近顶尖模型的语言理解与推理能力。2024年2月首发即有两个版本（20亿和70亿参数），同时在18个基于文本任务的基准测试中，有11个表现优于同等规模的开源模型
02

Apache 2.0全面开源，商用再无顾虑

自2026年4月起，谷歌将旗下所有Gemma系列模型的许可证全面切换为OSI认证的Apache 2.0。可自由修改代码与权重，利用私有数据微调模型，甚至将衍生模型用于商业目的分发给客户，均无需额外授权或支付分成。Gemma由此成为主流厂商阵营中少有的“真开源且商用无门槛”大模型
03

首发投入端侧生态，边缘算力也能跑

Gemma从一开始就把高效运行在端侧设备当作核心设计目标之一。Gemma 4系列中甚至有专门优化的E2B和E4B版本，设计目标就是跑在2GB内存的手机和物联网设备上，配合量化技术，大部分参数的模型都能在本地流畅执行，数据不出设备，隐私性也更有保障
04

Kaggle+Colab+Vertex AI，一条龙免费算力

开发者可在Kaggle平台免费获取预训练权重和微调checkpoints，在Google Colab直接加载开源模型进行实验和微调。TensorFlow、PyTorch、JAX实现全覆盖，配合Google Cloud的科研积分，从零开始上手几乎零硬件成本。Kaggle平台上已积累完善的教程和示例代码库
05

三层安全机制+红队测试

谷歌在整个模型开发流程中做了三层安全管控：数据过滤层去除有害训练内容、自动化基准测试层把关主流安全指标、人工红队测试层模拟真实对抗环境。Gemma官方技术报告中披露了在超过30个安全相关基准上的评测数据，并配备全套安全工具包，合规团队可以直接拿来审

应用场景

✅ 本地化AI应用开发

把模型部署到个人笔记本或工作站上跑自然语言任务，无需联网，数据全程在本地处理
✅ 学术研究与实验

Kaggle和Colab上免费调取预训练权重和微调版本，做推理效率对比、蒸馏实验或微调特定领域模型
✅ 产品快速原型验证

创业团队或产品经理用Gemma快速验证AI功能的可行性，跑通业务流程后再考虑是否上更大参数模型
✅ 移动端AI功能集成

小尺寸版本（Gemma 3 270M、2B）配合INT4量化，可以直接嵌入到手机App里实现本地文本理解、分类或摘要
✅ 企业专属模型微调

基于Apache 2.0许可，企业用内部数据微调出自己的专属模型，部署在私有环境中做客服、文档分析等业务
✅ 代码编写辅助

通过CodeGemma、RecurrentGemma等变体直接在本地进行代码生成与补全，降低云端API延迟依赖
✅ 多模态内容理解

上传商品图片和产品说明，Gemma 3 27B多模态版本同时理解两种输入，给出分类或总结结果

常见问题

解答您关于"Gemma"的常见疑问，让您更好地使用这款AI工具

Gemini是谷歌的闭源商用大模型（能力最强但不开源），Gemma是基于Gemini同源技术衍生出的开源轻量级版本。Gemma参数量更小，主打开放、可部署、可商用
Apache 2.0许可证是OSI认证的，允许任意修改、再分发和商用，无需通知谷歌或支付额外费用。是主流AI大厂里限制最少的一档
2B版本FP16精度下需约5GB显存，INT4量化后仅需2GB；7B版本FP16约14GB显存，INT4量化后约5-6GB。一块消费级显卡足以运行中小版本
官方原生支持JAX、PyTorch、TensorFlow，Hugging Face和Kaggle均有预置镜像。支持在CPU、GPU、TPU上推理，并配有ONNX Runtime、TensorRT等扩展部署方案
模型权重托管在Kaggle和Hugging Face上，镜像站可正常下载。谷歌官方文档页ai.google.dev部分地区可直接访问，配合Kaggle Notebook、Colab等云环境使用体验更顺畅
此前谷歌对Gemma采用自定义许可，商用存在“模型衍生品”法律灰色地带，企业法务需要大量审核。Apache 2.0直接消除了这些模糊条款，企业可自由微调、分发、商用，无需额外法务评估

立即体验 Gemma

Gemma是谷歌DeepMind基于Gemini同源技术打造的轻量级开源AI模型家族。支持从智能手机到服务器的全设备部署，提供多种参数版本。Gemma 4已全面切换至Apache 2.0许可证，是全球首个获OSI认证的开源商用大模型。Gemma 3引入多模态能力，支持文本与图像输入，上下文长达128K token，覆盖超140种语言。模型集成JAX、PyTorch、TensorFlow等主流框架，并提供Kaggle、Google Colab免费资源及开源工具链。开发者可基于Apache 2.0自由微调、商用甚至再分发。适合希望在本地高效运行LLM的开发者、研究人员及企业AI团队。

进入 Gemma

Gemma网站入口 · 本页面为非官方内容聚合页面，仅为Gemma的相关介绍和快捷入口 · 官方平台：Gemma

特别声明：AI导航站提供的【Gemma】产品信息来源于网站整理或服务商提交，从本站跳转后由【Gemma】网站提供服务，请用户注意自行甄别【Gemma】产品服务条款及隐私政策。在收录时，该网页上的内容都属于合规合法，后期【Gemma】产品网页内容如出现违规，请及时联系站长删除，AI导航网不承担任何责任。

Gemma

谷歌轻量级开源AI模型

核心功能

多参数版本选择

多模态理解

超长上下文窗口

140+语言原生支持

多框架无缝集成

本地化高效部署

产品特色

Gemini同源技术，轻量不失水准

Apache 2.0全面开源，商用再无顾虑

首发投入端侧生态，边缘算力也能跑

Kaggle+Colab+Vertex AI，一条龙免费算力

三层安全机制+红队测试

应用场景

✅ 本地化AI应用开发

✅ 学术研究与实验

✅ 产品快速原型验证

✅ 移动端AI功能集成

✅ 企业专属模型微调

✅ 代码编写辅助

✅ 多模态内容理解

常见问题

立即体验 Gemma