当谷歌的新 AI 模型可以在 1 个 H100 上运行，这对英伟达意味着什么？

分析认为，谷歌此举是对英伟达在 AI 硬件市场主导地位的一次挑战——通过提供能在多种硬件平台高效运行的模型，谷歌正在减轻开发者对高端英伟达 GPU 的依赖。目前，英伟达因其在 AI 训练和推理方面的优势，享有约 80% 的市场份额，但随着像 Gemma 3 这样的优化模型出现，以及 Google TPU 等替代硬件平台的发展，这种垄断局面可能逐渐被打破。

谷歌近日发布的 Gemma 3 模型无需大量部署 GPU 就能运行先进 AI 应用，对英伟达在 AI 硬件市场主导地位发起挑战。

谷歌声称，Gemma 3 是 “全球最强的单加速器（single-accelerator）模型”，针对英伟达 GPU 和专用 AI 硬件进行了优化，能够在单芯片（英伟达的 H100 或谷歌的 TPU）上高效运行，超过了 DeepSeek 的 R1（34 个 H100）和 Meta 的 Llama 3（16 个），突出了 AI 推理阶段的成本效益优势。

因此，用户无需购买大量 GPU 就能部署先进 AI 应用——谷歌正在减轻开发者对高端英伟达 GPU 的依赖。

此外，Gemma 3 的视觉编码器也已升级，可支持高分辨率和非方形图像。谷歌还推出了 ShieldGemma 2 图像安全分类器，可用于过滤输入和输出内容，以识别色情、危险或暴力内容。

英伟达的垄断局面可能逐渐被打破

Gemma 3 模型的一大亮点是其对硬件的兼容性和效率。根据 Wall Street Pit 的报道，该模型被设计为能在各种计算环境中工作，包括在低端硬件上也能保持良好性能，这意味着开发者和用户无需高昂的 GPU 投资就能部署先进 AI 应用。

并且，谷歌为 Gemma 3 提供了完整的开发工具套件，包括集成到各种流行框架的能力，如 TensorFlow、JAX 和 PyTorch 等。同时，谷歌还宣布了与 Hugging Face 的合作，将 Gemma 3 模型更广泛地分发给开发者社区。

谷歌计划在未来几个月内发布更多 Gemma 3 模型变体，提供更多的参数规模和特定领域的优化版本。这一系列举措表明，谷歌正在积极构建一个开放、多元的 AI 生态系统，既支持学术研究，也促进商业应用的创新。

分析认为，谷歌此举是对英伟达在 AI 硬件市场主导地位的一次挑战——通过提供能在多种硬件平台高效运行的模型，谷歌正在减轻开发者对高端英伟达 GPU 的依赖。

这种策略可能在长期内改变 AI 计算市场格局。目前，英伟达因其在 AI 训练和推理方面的优势，享有约 80% 的市场份额，但随着像 Gemma 3 这样的优化模型出现，以及 Google TPU 等替代硬件平台的发展，这种垄断局面可能逐渐被打破。