英伟达 H20“退烧” 国产 GPU 向前
英伟达 H20 芯片降价引起市场波动,多只 A 股算力概念股遭受重创。降价原因是市场需求低迷和竞争压力。华为等本土 AI 芯片供应商崛起加剧了国产算力卡与外资品牌的竞争。英伟达在中国市场销售额大幅下降,管理层预计中国市场将面临激烈竞争。此前,英伟达在中国销售收入占据数据中心业务总收入的比例已降至 14%。
英伟达 H20 芯片降价的消息近期在市场上引起轩然大波。
受此影响,A 股多只算力概念股遭遇重创。5 月 27 日,利通电子、真视通、鸿博股份(维权)等公司的股价均大幅下跌,其中利通电子更是跌停。5 月 28 日,板块持续走低。
据悉,英伟达此次对 H20 芯片进行降价的原因主要是市场需求不佳以及竞争对手的压力。
在受访智算中心从业人士看来,H20 芯片自面世以来就因算力远低于 H100 及 H800 芯片而被市场质疑。随着华为等本土 AI 芯片供应商的崛起,英伟达在中国市场面临更为激烈的竞争。
对于这一事件,受访投研人士对记者表示,随着国家对人工智能技术的重视程度不断提高,国产算力卡正逐渐成为市场的新宠。在这一背景下,英伟达 H20 降价将进一步加剧国产算力卡与外资品牌之间的竞争。
英伟达 H20 退烧?
随着人工智能、云计算等领域的快速发展,对 GPU 的需求也在持续增长。尤其是在大模型训练、自动驾驶、智慧城市等应用场景中,GPU 发挥着不可替代的作用。
在 GPU 领域,英伟达一直被视作风向标般的存在,该公司的 GPU 芯片一度在中国市场供不应求。但近期,其针对中国市场特供的 GPU 芯片行情似乎出现了细微变化。
5 月 23 日美股盘后,英伟达发布 2025 财年首季的财报。报告期间营收高达 260.44 亿美元,同比增长 262%,环比也增长了 18%。同时,其净利润达到 148.8 亿美元,同比增长 628%。
值得注意的是,虽然英伟达在报告期间推出了对华特供芯片 H20,但英伟达高管在财报会上表示,该公司在中国的销售额在报告期间大幅下降。
面对这一挑战,英伟达管理层预计,未来中国市场将面临非常激烈的竞争态势。
回顾过往,2023 财年英伟达在中国的销售收入占据了数据中心业务总收入的 19%,然而到了 2024 财年,这一比例已经降至 14%,显示出英伟达在中国市场的业务面临着不小的挑战。
紧接着,在 5 月 24 日,有媒体报道称,英伟达专为中国市场开发的最先进的 AI 芯片开局不力,英伟达下调供应中国市场的 H20 人工智能芯片价格。
英伟达 H20 中国特供芯片是一款专为中国市场打造的 AI 芯片,它被视为 H100 GPU 的 “阉割版”,性能较 H100 有所降低。
从内存容量来看,H20 芯片拥有 96GB 的 HBM3 内存,相比 H100 的 80GB HBM3 内存略小。其运算能力达到 296 TFLOPs,亦低于 H100 的 1979 TFLOPs。
据悉,英伟达在 2024 年 2 月初给 H20 芯片的定价设置在了 1.2 万美元至 1.5 万美元之间,折合人民币约为 8.5 万元至 10.7 万元。然而,一些经销商在初期加价,导致 H20 的起售价高达 11 万元。而目前,H20 芯片单卡报价已降至约 10 万元。
是什么导致英伟达针对 H20 芯片主动调整市场策略?
研究机构 SemiAnalysis 的创始人 Dylan Patel 表示,2024 年下半年将有近 100 万片 H20 芯片运往中国,因此英伟达必须在价格上与华为竞争。
前述报道称,华为今年将大幅增加其 Ascend 910B 芯片的出货量,后者在一些关键指标上的表现优于 H20。在某些情况下,H20 芯片的售价比华为 Ascend 910B 低 10% 以上。
开源证券分析师蒋颖认为,由于贸易政策限制,当前国内算力缺口较大,国产算力后来居上,以华为昇腾为代表的国产算力在应用、框架、基础软件、硬件方面不断优化,部分算力性能指标超过 H20,算力网络组网速率不断升级。
国产 GPU 向前
英伟达 H20 价格下调的同时,国产 GPU 在大型模型训练中的实力和潜力得到了充分验证。
诸如华为昇腾 910B、摩尔线程的全功能 GPU 芯片以及寒武纪的思元 590 芯片等国产芯片,逐渐向 “C 位” 靠拢。
其中,昇腾 910 于 2019 年 8 月 23 日由华为在深圳正式发布,并配套发布了新一代 AI 开源计算框架 MindSpore。
2023 年 3 月,华为昇腾与旗下华鹏振宇打造了专为高校和科研院所设计的 AI 训练开发一体机。此后,其应用范围由科研逐步扩展到 AI 全场景乃至垂类模型落地。
“科大讯飞在今年 1 月已经组建万卡集群,是全国产化的,来自华为昇腾。并且在全国产化的算力基础上进行专门调优。最开始效率只能达到英伟达 30%~40%,后来在算法、算力、算子库上面不断训练,现在的能效提升很多。” 科大讯飞副总裁王玮近期对媒体表示。
近期,国产 GPU 利好消息频传。摩尔线程日前与无问芯穹联合宣布,使用 MTT S4000 组成的千卡集群成功完成了基于 MT-infini-3B 3B(30 亿参数)规模大模型的实训,且集群训练稳定性达到 100%,相比单机扩展效率超过 90%。
5 月 7 日,据 “中国光谷” 消息,凌久微宣布,其自主设计的第二代图形处理器(GPU)GP201 已成功量产上市。
摩尔线程近期与无问芯穹联合宣布,双方已经成功完成基于 MT-infini-3B 3B ( 30 亿参数 ) 规模大模型的实训。实训过程中,使用了摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群,以及无问芯穹的 AIStudio PaaS 平台。
与此同时,国家和地方政府对国产 GPU 的发展也给予了大力支持。
例如,《北京市算力基础设施建设实施方案(2024-2027 年)》提出了对企业采购自主可控 GPU 芯片开展智能算力服务的支持政策,旨在加速实现智算资源供给自主可控。
政策的支持不仅体现在资金补贴上,还包括推动智算中心建设、打造满足各类人工智能算力需求的基础设施体系等方面。
从市场规模来看,第三方机构中商产业研究院发布的《2024-2029 年中国算力网络行业发展洞察与市场前景预测研究报告》显示,2023 年中国智能算力市场规模达到 5097 亿元,同比增长 143.64%;预计今年中国智能算力市场规模将增长至 8690 亿元。
有业内人士对记者表示,目前来看,国产 GPU 技术性能与国际巨头仍有一定差距、产业生态仍需进一步健全等。不过,随着国家政策的持续支持和市场需求的不断增长,国产 GPU 有望逐渐和巨头缩小差距。