Gemma
谷歌轻量级开源AI模型
从智能手机到服务器都能跑,支持多模态,Apache 2.0商用无门槛

核心功能
多参数版本选择
提供1B、2B、4B、9B、12B、27B、26B、31B等多种规模,适配边缘计算、端侧设备到服务器集群
多模态理解
Gemma 3及后续版本支持文本与图像联合输入,在问答、摘要、推理等任务中表现优异
超长上下文窗口
最大支持128K token上下文(约一部中篇小说的体量),是Gemma 2的16倍
140+语言原生支持
涵盖全球主要语种,真正实现开箱即用的跨语言能力
多框架无缝集成
官方原生支持JAX、PyTorch、TensorFlow,Hugging Face一键加载,Keras 3统一API
本地化高效部署
2B模型仅需约2GB显存(INT4量化),可在普通笔记本CPU和智能手机上运行
产品特色
- 01
Gemini同源技术,轻量不失水准
Gemma团队直接复用Gemini模型的架构设计和训练数据配方,从底层的模型架构、注意力机制到训练基础设施一脉相承,以轻量化的体积承载接近顶尖模型的语言理解与推理能力。2024年2月首发即有两个版本(20亿和70亿参数),同时在18个基于文本任务的基准测试中,有11个表现优于同等规模的开源模型
- 02
Apache 2.0全面开源,商用再无顾虑
自2026年4月起,谷歌将旗下所有Gemma系列模型的许可证全面切换为OSI认证的Apache 2.0。可自由修改代码与权重,利用私有数据微调模型,甚至将衍生模型用于商业目的分发给客户,均无需额外授权或支付分成。Gemma由此成为主流厂商阵营中少有的“真开源且商用无门槛”大模型
- 03
首发投入端侧生态,边缘算力也能跑
Gemma从一开始就把高效运行在端侧设备当作核心设计目标之一。Gemma 4系列中甚至有专门优化的E2B和E4B版本,设计目标就是跑在2GB内存的手机和物联网设备上,配合量化技术,大部分参数的模型都能在本地流畅执行,数据不出设备,隐私性也更有保障
- 04
Kaggle+Colab+Vertex AI,一条龙免费算力
开发者可在Kaggle平台免费获取预训练权重和微调checkpoints,在Google Colab直接加载开源模型进行实验和微调。TensorFlow、PyTorch、JAX实现全覆盖,配合Google Cloud的科研积分,从零开始上手几乎零硬件成本。Kaggle平台上已积累完善的教程和示例代码库
- 05
三层安全机制+红队测试
谷歌在整个模型开发流程中做了三层安全管控:数据过滤层去除有害训练内容、自动化基准测试层把关主流安全指标、人工红队测试层模拟真实对抗环境。Gemma官方技术报告中披露了在超过30个安全相关基准上的评测数据,并配备全套安全工具包,合规团队可以直接拿来审
应用场景
✅ 本地化AI应用开发
把模型部署到个人笔记本或工作站上跑自然语言任务,无需联网,数据全程在本地处理
✅ 学术研究与实验
Kaggle和Colab上免费调取预训练权重和微调版本,做推理效率对比、蒸馏实验或微调特定领域模型
✅ 产品快速原型验证
创业团队或产品经理用Gemma快速验证AI功能的可行性,跑通业务流程后再考虑是否上更大参数模型
✅ 移动端AI功能集成
小尺寸版本(Gemma 3 270M、2B)配合INT4量化,可以直接嵌入到手机App里实现本地文本理解、分类或摘要
✅ 企业专属模型微调
基于Apache 2.0许可,企业用内部数据微调出自己的专属模型,部署在私有环境中做客服、文档分析等业务
✅ 代码编写辅助
通过CodeGemma、RecurrentGemma等变体直接在本地进行代码生成与补全,降低云端API延迟依赖
✅ 多模态内容理解
上传商品图片和产品说明,Gemma 3 27B多模态版本同时理解两种输入,给出分类或总结结果
常见问题
解答您关于"Gemma"的常见疑问,让您更好地使用这款AI工具
-
Gemini是谷歌的闭源商用大模型(能力最强但不开源),Gemma是基于Gemini同源技术衍生出的开源轻量级版本。Gemma参数量更小,主打开放、可部署、可商用
-
Apache 2.0许可证是OSI认证的,允许任意修改、再分发和商用,无需通知谷歌或支付额外费用。是主流AI大厂里限制最少的一档
-
2B版本FP16精度下需约5GB显存,INT4量化后仅需2GB;7B版本FP16约14GB显存,INT4量化后约5-6GB。一块消费级显卡足以运行中小版本
-
官方原生支持JAX、PyTorch、TensorFlow,Hugging Face和Kaggle均有预置镜像。支持在CPU、GPU、TPU上推理,并配有ONNX Runtime、TensorRT等扩展部署方案
-
模型权重托管在Kaggle和Hugging Face上,镜像站可正常下载。谷歌官方文档页ai.google.dev部分地区可直接访问,配合Kaggle Notebook、Colab等云环境使用体验更顺畅
-
此前谷歌对Gemma采用自定义许可,商用存在“模型衍生品”法律灰色地带,企业法务需要大量审核。Apache 2.0直接消除了这些模糊条款,企业可自由微调、分发、商用,无需额外法务评估
立即体验 Gemma
Gemma是谷歌DeepMind基于Gemini同源技术打造的轻量级开源AI模型家族。支持从智能手机到服务器的全设备部署,提供多种参数版本。Gemma 4已全面切换至Apache 2.0许可证,是全球首个获OSI认证的开源商用大模型。Gemma 3引入多模态能力,支持文本与图像输入,上下文长达128K token,覆盖超140种语言。模型集成JAX、PyTorch、TensorFlow等主流框架,并提供Kaggle、Google Colab免费资源及开源工具链。开发者可基于Apache 2.0自由微调、商用甚至再分发。适合希望在本地高效运行LLM的开发者、研究人员及企业AI团队。