Rare! Report: NVIDIA's latest AI chip delayed due to design flaws

华尔街见闻
2024.08.03 04:23
portai
I'm PortAI, I can summarize articles.

英伟达最新 AI 芯片因设计缺陷推迟发布三个月或更长时间,可能会影响到一些客户的计划。这对于 Meta Platforms、谷歌和 Microsoft 等公司来说是一个重大事件,因为它们已经订购了价值数百亿美元的芯片。英伟达正在与芯片制造商台积电合作解决问题,并计划在今年晚些时候提高芯片的产量。这次在大规模生产之前发现设计缺陷的情况是非常罕见的。

英伟达新的 Blackwell 系列芯片中最先进的 AI 芯片可能面临延迟发布。

据 The Information 援引知情人士称,英伟达即将推出的人工智能芯片将因设计缺陷而推迟三个月或更长时间。

这可能会影响 Meta Platforms、谷歌和 Microsoft 等客户,这些公司集体订购了价值数百亿美元的芯片。

英伟达方面不愿就有关延迟的声明发表评论,但表示客户正在测试 Blackwell 芯片的样品,并且今年晚些时候 “产量有望提高”。

在大规模生产之前发现重大设计缺陷并不常见

The Information 援引参与 Blackwell 芯片制作人士称,最近几周出现了 Blackwell 设计问题,因为台积电的工程师在准备大规模生产时发现了缺陷。

GB200 芯片包含两个连接的 Blackwell GPU 和一个 Grace 中央处理单元。该缺陷问题涉及一个处理器芯片(一块用于容纳芯片电路的硅片),该芯片连接了两个 Blackwell GPU。这一障碍降低了台积电能够为英伟达生产的芯片产量。甚至有可能使公司停止生产。

报道称,英伟达正在与其芯片制造商台积电进行新的试生产运行,以解决问题。

按照原计划,台积电将在第三季度开始大规模生产 Blackwell 芯片,并从第四季度开始交付给英伟达,如果没有进一步问题,服务器将在随后几个季度大规模出货。

分析认为,在大规模生产之前发现重大设计缺陷是非常不寻常的。因为前期需要进行多次生产测试运行和模拟,以确保产品的可行性和顺利的制造过程。

如果即将推出的 B100、B200 和 GB200 等 AI 芯片推迟三个月或更长时间,可能会导致一些客户无法如期按照计划在 2025 年第一季度运行大型芯片集群。

设计缺陷还将影响 Nvidia NVLink 服务器机架的生产和交付,因为从事服务器工作的公司必须等待新的芯片样品,然后才能最终确定服务器机架设计。

持续更新中……