
Google open-sources the Gemma-3 model: supports multi-modal, 128K input, 27B version surpasses DeepSeeK V3 in the large model anonymous arena, free commercial use license

谷歌于 2025 年 3 月 12 日开源了 Gemma-3 系列大模型,包含四个不同参数规模版本,支持多模态输入。Gemma 3-27B 版本在大模型匿名竞技场中超越 DeepSeeK V3,具备 128K 上下文输入能力,支持 140 多种语言,且提供免费商用授权。该系列模型的训练数据量达到 14 万亿,展现出强大的表征能力。
Gemma 系列大模型是 Google 开源的一系列轻量级的大模型。就在刚才(2025 年 3 月 12 日),Google 开源了第三代 Gemma 系列大模型,共包含 4 个不同参数规模版本,第三代的 Gemma 3 系列是多模态大模型,即使是最小的 10 亿参数规模的 Gemma 3-1B 也支持多模态输入。

- Gemma 3 系列模型介绍及其特点
- Gemma 3 系列模型的评测非常优秀
- Gemma 3 开源情况
Gemma 3 系列模型介绍及其特点
Gemma 系列大模型与 Google 的 Gemini 系列模型技术同源,但是以免费商用授权的方式开源。最早于 2024 年 2 月份开源,当时只有 20 亿参数规模的 Gemma 2B 模型和 70 亿参数规模的 Gemma 7B 模型,且上下文长度也就 8K。2024 年 5 月,Google 开源了 Gemma2 系列,版本的范围也增加到 3 个,分别是 2B、9B 和 27B 规模。
其中,Gemma 3 - 27B 版本模型在 14 万亿数据集上训练,Gemma 3-12B 在 12 万亿数据集上训练,剩下 2 个版本分别是 4 万亿数据和 2 万亿数据训练。
Gemma 3 的词汇表达到了 262K,可以说表征能力非常强大。
10 个月后的今天,Google 开源了第三代 Gemma 3 系列大模型,版本范围增加到了 4 个,分别是 1B、4B、12B 和 27B,并且从纯粹的大语言模型升级到了多模态大模型,即支持图片和视频的输入。
此次,Gemma 3 的升级很大,总结如下:
-
Gemma 3 系列模型最高支持 128K 的上下文输入(10 亿参数版本的 Gemma 3-1B 仅支持 32K) -
Gemma 3 系列支持多达 140 多种语言 -
Gemma 3 系列大模型支持多模态输入,包括文本、图片、视频输入 -
Gemma 3 系列支持函数调用/工具调用
Gemma 3 系列模型的评测非常优秀
Gemma 3 系列模型包含 4 个版本,每个版本均开源了预训练基座版本(pt 后缀版本,表示 pre-training)和指令微调后的版本(it 后缀版本,表示 instruction fine-tuned),也就是说共开源了 8 个版本的大模型。
而最大参数规模的 Gemma 3-27B IT 的 fp16 精度大小为 54.8GB,int8 量化后 27GB,两张 4090 可用,INT4 量化后需要 14GB 显存,单张 4090 完全没问题。
而这个版本的模型评测结果非常好,在大模型匿名竞技场(Chatbot Arena)上得分 1338 分(截至 2025 年 3 月 8 日),排名全球第 9,仅次于 o1-2024-12-17 模型,超过了 Qwen2.5-Max 以及 DeepSeek V3 等。

而在常规的其它评测上表现也很不错,评测结果超越了 Qwen2.5-72B,与 DeepSeek V3 等也非常接近。

按照 Google 官方的说法,本次 Gemma 3 系列提升很明显,其中 Gemma 3-4B 版本模型水平接近 Gemma 2-27B,而 Gemma 3-27B 则接近 Gemini 1.5-Pro!
Gemma 3 开源情况
Gemma 3 系列的 8 个模型以 Gemma 开源协议开源。允许商用,免费授权。
而生态适配上也早都完成,Huggingface、Ollama、Vertex、llama.cpp 都已经支持。
本文作者:DataLearner,来源:DataLearner,原文标题:《重磅!谷歌开源 Gemma-3 模型:支持多模态、128K 输入,27B 版本在大模型匿名竞技场超过 DeepSeeK V3,免费商用授权》
