英偉達推出新款 AI 芯片 H200,性能再飛躍,股價有望九連漲

华尔街见闻
2023.11.13 15:38
portai
我是 PortAI,我可以總結文章信息。

英伟达对其火爆的 H100 GPU 进行重磅升级,以巩固市场主导地位。英伟达推出 H200 新款 GPU,具备使用 HBM3e 高带宽内存的能力,集成 141GB 内存,在 Llama 2 上的推理速度比 H100 快一倍。大型计算机制造商和云服务提供商预计明年二季度开始使用。

北京时间周一晚,英伟达发布下一代人工智能超算芯片。

英伟达对其火爆的 H100 人工智能 GPU 进行了重磅升级,最新款高端芯片名为 H200,基于英伟达的 “Hopper” 架构,是该公司第一款使用 HBM3e 高带宽内存的 GPU,这种内存速度更快、容量更大,因此更适合处理大型数据集,而这是开发大型语言模型所必需的。

英伟达公司表示,基于 HBM3e,H200 以每秒 4.8 TB 的速度提供 141GB 的内存,与 A100 相比,容量几乎是其两倍、带宽增加了 2.4 倍。

在备受瞩目的人工智能领域,英伟达提到,H200 将带来进一步的性能飞跃。在 Llama 2(700 亿参数的 LLM)上的推理速度比 H100 快了一倍。未来的软件更新预计会给 H200 带来额外的性能领先优势和改进。

H200 将在具有四路和八路配置的英伟达 HGX H200 服务器主板中提供,并与 HGX H100 系统的硬件和软件兼容。

大型计算机制造商和云服务提供商预计将于明年第二季度开始使用 H200。亚马逊的 AWS、Alphabet 公司的谷歌云和甲骨文的云基础设施,都承诺从明年开始使用这款新芯片。

英伟达负责超大规模和高性能计算的副总裁 Ian Buck 表示,“要通过生成式 AI 和高性能计算 HPC 应用程序来创建智能,必须使用大型、快速的 GPU,高速有效地处理大量数据。借助 H200,业界领先的端到端 AI 超级计算平台能够更快地解决世界上一些最重要的挑战。”

英伟达表示,通过新产品,公司正试图跟上用于创建人工智能模型和服务的数据集的规模。添加增强的内存能力将使 H200 在用数据轰炸软件时速度更快,也即训练 AI 执行图像识别和语音等任务的过程。媒体援引英伟达数据中心产品的负责人的话说,“当你观察市场上正在发生的事情时,你会发现模型正在迅速扩大。这是我们继续迅速推出最新、最先进技术的又一个例子。”

英伟达早盘一度追随美股大盘小幅下跌,盘中急速拉涨,上涨约 1.4%,有望连续第九个交易日上涨。

伴随着人工智能的火爆,英伟达的高端 GPU 需求量极大。这也令其他芯片制造商瞄准这一利润丰厚的市场,加快推出高品质的 AI 芯片,整个 AI 芯片市场竞争相当激烈。英伟达此举旨在巩固其在 AI 计算市场的主导地位。

AMD 将于本季度推出 MI300 芯片,AMD 透露,已有多家超大规模云服务商承诺将部署 MI300 芯片产品。华尔街见闻网站此前提及,业内人士透露,拥有更大显存的 MI300,在部署 32K 上下文窗口的 GPT-4 模型时效果更好。具体来说,与 H100 相比,MI300 的性能优势在 20%-25%,具体取决于上下文长度和提示长度/每次查询输出的 token 数量。

此外,英特尔公司声称其 AI 芯片 Gaudi 2 比 H100 更快。

近日市场还关注的热点是,英伟达已开发出针对中国市场的最新改良版系列芯片——HGXH20、L20PCle 和 L2PCle。据澎湃新闻,有知情人士称,最新三款芯片是由 H100 改良而来。英伟达最快或将于本月 16 号之后公布,国内厂商最快将在这几天拿到产品。多位产业链人士均证实英伟达改良版芯片属实。

对此,环球时报评论文章称,有人说,美国政府和英伟达展开了一场限制与反限制的 “猫鼠游戏”。从表面上看好像是这样,但这个比喻模糊了问题的本质,也混淆了是非。英伟达和美国政府的这几个回合,是一个正当做生意的高科技企业,遭遇来自政治对自由贸易的强力干扰、束缚和破坏,为了自己的生存与发展想尽办法的故事。对商业公司来说,这一点也不搞笑,甚至有些悲哀。美国对华的芯片出口管制措施是没道理的,它不仅对中国利益有害,也对美国利益有害,已经有越来越多的人看到这一点,并希望华盛顿作出调整。

英伟达将于下周公布财报。今年其 AI GPU 广受欢迎,推动了该公司业绩的井喷。市场预计英伟达本财报季的收入将激增 170%。