连月挑战 OpenAI！谷歌发布更高效 Gemini 3 Flash，App 默认模型，上线即加持搜索

评估代理编程能力的基准测试中，Gemini 3 Flash 的得分甚至高于 Gemini 3 Pro。新 Flash 模型保持了接近 Gemini 3 Pro 的推理能力，同时运行速度达到 Gemini 2.5 Pro 的三倍，成本仅为 Gemini 3 Pro 的四分之一；定价 0.5 美元/百万输入 token 、3.00 美元/百万输出 token，略高于 Gemini 2.5 Flash，但性能超越 2.5 Pro，速度是后者三倍。

旗下最强模型 Gemini 3 Pro 发布才过一个月，谷歌就进一步向 OpenAI 发起挑战。

美东时间 17 日周三，谷歌宣布推出 Gemini 3 家族的新成员 Flash。这款主打快速高效的新模型发布当天即取代 Gemini 2.5 Flash 成为 Gemini App 的默认模型，并同步成为谷歌搜索 AI 模式的默认驱动系统，标志着谷歌在 AI 竞赛中的分发优势正转化为实质性的市场攻势。

谷歌正将其最强 AI 能力以更低成本、更快速度推向全球数百万用户。谷歌 DeepMind 的 Gemini 产品管理高级总监 Tulsee Doshi 称，谷歌将 Flash 定位为老黄牛式的模型。该模型保持了接近 Gemini 3 Pro 的推理能力，同时运行速度达到 Gemini 2.5 Pro 的三倍，成本仅为 Gemini 3 Pro 的四分之一。

Doshi 表示："几周前我们发布了 Pro，对市场反响感到兴奋。通过 Gemini 3 Flash，我们将这个模型带给所有人。" 他还提到，评估代理编程能力的基准测试 SWE-bench Verified 显示，Gemini 3 Flash 性能还优于 Gemini 3 Pro。

Gemini 3 Flash 的发布正值谷歌与 OpenAI 竞争的日趋白热化。谷歌 11 月 18 日发布的 Gemini 3 系列促使 OpenAI 本月初拉响红色警报。上周报道称，Gemini 在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过 ChatGPT，但 ChatGPT 11 月下旬仍垄断 90% 的移动端会话。上周 OpenAI推出 GPT-5.2 迎战，本周二又发布新的图像生成模型GPT Image 1.5。

业内人士认为，这场日益演变为谷歌与 OpenAI 二元对抗的 AI 竞赛不仅对人工智能（AI）技术本身，也对整个经济产生重大影响。这种持续不断的发布周期反映了模型竞赛前沿领域残酷的竞争本质，任何公司都可能迅速从领先者沦为陪跑者。虽然 OpenAI 拥有先发优势，但 Gemini 在搜索和谷歌核心应用中的分发能力更为广泛。自 Gemini 3 发布以来，谷歌 API 每天处理的 token 数量已超过 1 万亿。

性能持平旗舰模型编程能力超越同门 Pro

Gemini 3 Flash 在多项基准测试中展现出接近甚至超越更大型模型的表现。

在 SWE-bench Verified 基准测试中，Gemini 3 Flash 的解决率达到 78%，仅次于 GPT-5.2 的 80%，不仅超越 Gemini 2.5 系列，甚至优于同门的 Gemini 3 Pro，Pro 的准确率为 76.2%。

在跨领域专业知识测试 Humanity's Last Exam 中，Gemini 3 Flash 在不使用工具的情况下得分 33.7%，虽低于 Gemini 3 Pro 的 37.5% 和 GPT-5.2 的 34.5%，但远超 Gemini 2.5 Flash 的 11%。

在多模态推理基准测试 MMMU-Pro 中，Gemini 3 Flash 以 81.2% 的得分超越包括 Gemini 2.5 和 Gemini 3 Pro 在内的所有竞争对手。

在博士级推理和知识基准 GPQA Diamond 上，Gemini 3 Flash 的得分为 90.4%。虽然低于 GPT-5.2 的 92.4% 和 Gemini 3 Pro 的 91.9%，但其他对手得分还都不到 90%。

Doshi 对媒体表示：“我们将 Flash 定位为更像老黄牛的模型。从输入和输出价格来看，Flash 从成本角度来说是便宜得多的产品，这实际上允许许多公司进行批量任务。”

成本优势明显速度是 2.5 Pro 三倍

Gemini 3 Flash 的定价为每 100 万输入 token 0.50 美元，每 100 万输出 token 3.00 美元。虽然略高于 Gemini 2.5 Flash 的每 100 万输入 token 0.30 美元和输出 token 2.50 美元，但谷歌表示，新一代 Flash 模型性能超越 Gemini 2.5 Pro，速度却达到其三倍。

更重要的是，在处理需要思考的任务时，Gemini 3 Flash 平均使用的 token 数量比 2.5 Pro 少 30%。这意味着尽管单位价格略高，但在某些任务中用户的总体 token 消耗量会减少，最终实现成本节约。

Gemini 3 Flash 在 Gemini API 和 Vertex AI 平台中还配备标准上下文缓存功能，能够在重复使用 token 达到一定阈值的应用中实现高达 90% 的成本削减。

谷歌强调，Gemini 3 Flash 能够以不到 Gemini 3 Pro 四分之一的成本支持 AI 代理工作流，同时提供更高的速率限制。

全面覆盖产品线桥水、Salesforce 等企业客户已 “尝鲜”

Gemini 3 Flash 即日起面向全球用户推出，覆盖消费者、开发者和企业三大群体。在 Gemini App 中，所有全球用户可免费使用该模型，用户仍可从模型选择器中切换至 Pro 模型处理数学和编程问题。在谷歌搜索的 AI 模式中，Gemini 3 Flash 成为默认模型，美国用户还可访问更强大的 Gemini 3 Pro 进行深度思考任务。

对于开发者，该模型已通过 Google AI Studio、Gemini CLI、Vertex AI 和上月发布的新代码工具 Antigravity 提供预览版本，也可通过 Android Studio 等开发工具访问。企业用户可通过 Vertex AI 和 Gemini Enterprise 获取服务。

谷歌介绍，多家知名企业已开始使用 Gemini 3 Flash 进行业务转型，并得到他们的热烈反响，这些企业认可该模型的推理速度、效率和推理能力，认为它与更大的模型不相上下。

据谷歌，软件开发公司 JetBrains AI 工具生态系统负责人 Denis Shiryaev 表示："在我们的 JetBrains AI Chat 和 Junie 代理编程评估中，Gemini 3 Flash 提供了接近 Gemini 3 Pro 的质量，同时推理延迟和成本显著降低。"

全球最大对冲基金桥水（Bridgewater Associates）的 AIA Labs 负责人兼首席科学家 Jasjeet Sekhon 表示：“在桥水，我们需要能够在不牺牲概念理解的情况下处理大量非结构化多模态数据集的模型。Gemini 3 Flash 是第一个以我们工作流程所需的速度和规模提供 Pro 级深度的模型。”

Salesforce、Workday、Figma、Cursor、Harvey 和 Latitude 等公司也已采用该模型。谷歌搜索产品副总裁 Robby Stein 表示，新 Flash 模型将帮助用户处理具有多个条件的更精细搜索，例如查找适合有幼儿的父母的晚间活动。

连月挑战 OpenAI！谷歌发布更高效 Gemini 3 Flash，App 默认模型，上线即加持搜索

性能持平旗舰模型 编程能力超越同门 Pro

成本优势明显 速度是 2.5 Pro 三倍

全面覆盖产品线 桥水、Salesforce 等企业客户已 “尝鲜”

性能持平旗舰模型编程能力超越同门 Pro

成本优势明显速度是 2.5 Pro 三倍

全面覆盖产品线桥水、Salesforce 等企业客户已 “尝鲜”