黃仁勳在 COMPUTEX 大會上説了什麼？這裏是最全的亮點

英偉達 CEO 黃仁勳在 COMPUTEX 大會上拋出多個重磅信息，包括新的機器人設計、遊戲功能、廣告服務和網絡技術。其中最為引人矚目的是，搭載 256 顆 GH200 Grace Hopper 超級芯片的新型 DGX GH200 人工智能超級計算機，堪稱 “算力殺器”。谷歌雲、Meta 和微軟將是第一批獲得 DGX GH200 訪問權限的公司，並將對其功能進行研究。

5 月 29 日週一，英偉達 CEO 黃仁勳在 COMPUTEX 大會上拋出多個重磅信息，包括新的機器人設計、遊戲功能、廣告服務和網絡技術。其中最為引人矚目的是，搭載 256 顆 GH200 Grace Hopper 超級芯片的新型 DGX GH200 人工智能超級計算機，堪稱 “算力殺器”。

谷歌雲、Meta 和微軟是首批預計將獲得 DGX GH200 訪問權的客户，以探索其在生成型 AI 工作負載方面的能力。值得注意的是，算力的突破，將使得 AI 應用再次獲得巨大提升，AI 賽道有望向下一個節點邁進。在週一的演講中，黃仁勳認為科技行業的傳統架構的改進速度已不足以跟上覆雜的計算任務。為了充分發揮 AI 的潛力，客户越來越多地轉向加速計算和英偉達製造的 GPU。

黃仁勳説：

我們已到達生成式 AI 引爆點。從此，全世界的每個角落，都會有算力需求。

有評論認為，一連串的發佈凸顯了英偉達正在從一家 GPU 製造商轉變為一家處於 AI 熱潮中心的公司。

上週，由於對處理 AI 任務的數據中心芯片的強烈需求，英偉達大幅提高了對本季度的業績指引，比分析師的估計高出近 40 億美元。業績指引的提高使該股創下歷史新高，並使英偉達的估值接近 1 萬億美元，這還是芯片業中首次有公司市值達到這一高度。

在週一的會議上，黃仁勳發佈的主要內容包括：

英偉達面向遊戲玩家的 GForce RTX 4080 Ti GPU 現已全面投產，並已經開始量產。
黃仁勳宣佈推出適用於遊戲的英偉達 Avatar Cloud Engine（ACE），這是一種可定製的 AI 模型代工服務，為遊戲開發人員提供預訓練模型。它將通過 AI 支持的語言交互賦予非玩家角色更多個性。

英偉達 Cuda 計算模型現在服務於 400 萬開發者和超過 3000 個應用程序。Cuda 的下載量達到了 4000 萬次，其中僅去年一年就達到了 2500 萬次。
GPU 服務器 HGX H100 的全面量產已經開始，他補充説，這是世界上第一台裝有變壓器引擎的計算機。
黃仁勳將英偉達 2019 年以 69 億美元收購超級計算機芯片製造商 Mellanox 稱為其有史以來做出的 “最偉大的戰略決策之一”。
下一代 Hopper GPU 的生產將於 2024 年 8 月開始，也就是第一代開始生產兩年後。
英偉達的 GH200 Grace Hopper 現已全面投產。超級芯片提升了 4 PetaFIOPS TE、72 個通過芯片到芯片鏈路連接的 Arm CPU、96GB HBM3 和 576 GPU 內存。黃仁勳將其描述為世界上第一個具有巨大內存的加速計算處理器：“這是一台計算機，而不是芯片。” 它專為高彈性數據中心應用而設計。
如果 Grace Hopper 的內存不夠用，英偉達有解決方案——DGX GH200。它是通過首先將 8 個 Grace Hoppers 與 3 個 NVLINK 交換機以 900GB 傳輸速度的 Pod 連接在一起，再將 32 個這樣的組件連接在一起，再加上一層開關，連接總共 256 個 Grace Hopper 芯片。由此產生的 ExaFLOPS Transformer Engine 具有 144 TB 的 GPU 內存，可用作巨型 GPU。黃仁勳説 Grace Hopper 速度非常快，可以在軟件中運行 5G 堆棧。谷歌雲、Meta 和微軟將是第一批獲得 DGX GH200 訪問權限的公司，並將對其功能進行研究。

英偉達和軟銀已建立合作伙伴關係，將 Grace Hopper 超級芯片引入軟銀在日本的新分佈式數據中心。這些將能夠在多租户通用服務器平台中託管生成式人工智能和無線應用程序，從而降低成本和能源。
軟銀和英偉達的合作伙伴關係將基於英偉達 MGX 參考架構，該架構目前正在與一些公司合作使用。它為系統製造商提供了一個模塊化的參考架構，幫助他們構建 100 多個用於 AI、加速計算和全方位用途的服務器變體。合作的公司包括 ASRock Rack、Asus、Gigabyte、Pegatron、QCT 和 Supermicro。
黃仁勳發佈了 Spectrum-X 加速網絡平台，以提高基於以太網的雲的速度。它包括 Spectrum 4 交換機，它有 128 個端口，每秒 400GB 和每秒 51.2TB 的傳輸速度。黃仁勳説，該交換機旨在實現新型以太網，並設計為端到端以進行自適應路由、隔離性能和進行結構內計算。它還包括 Bluefield 3 Smart Nic，它連接到 Spectrum 4 交換機以執行擁塞控制。

世界上最大的廣告公司 WPP 已與英偉達 Nvidia 合作開發基於 Nvidia Omniverse 的內容引擎。它將能夠製作用於廣告的照片和視頻內容。
機器人平台英偉達 Isaac ARM 現在可供任何想要構建機器人的人使用，並且是全棧的，從芯片到傳感器。Isaac ARM 從名為 Nova Orin 的芯片開始，是第一個機器人全參考堆棧，Huang 説。

在發佈會上，黃仁勳還展示了生成式 AI 以文字形式輸入然後以其他媒體輸出內容的能力。他要求播放與清晨心情相配的音樂，而在另一篇文章中，他列出了一些歌詞，然後使用 AI 將這個想法轉化為一首活潑的流行歌曲：

現在每個人都是創作者。

值得注意的是，本次大會上，黃仁勳向傳統 CPU 服務器集羣發起 “挑戰”。他直言，認為在人工智能和加速計算這一未來方向上，GPU 服務器有着更為強大的優勢。

黃仁勳解釋稱，傳統上電腦或服務器最重要的 CPU，這個市場主要參與者包括英特爾和 AMD。但隨着需要大量計算能力的 AI 應用出現，GPU 將成為主角，英偉達主導了當前全球 AI GPU 市場。

黃仁勳在演講上展示的範例，訓練一個 LLM 大語言模型，將需要 960 個 CPU 組成的服務器集羣，這將耗費大約 1000 萬美元，並消耗 11 千兆瓦時的電力。相比之下，同樣以 1000 萬美元的成本去組建 GPU 服務器集羣，將以僅 3.2 千兆瓦時的電力消耗，訓練 44 個 LLM 大模型。

如果同樣消耗 11 千兆瓦時的電量，那麼 GPU 服務器集羣能夠實現 150 倍的加速，訓練 150 個 LLM 大模型，且佔地面積更小。而當用户僅僅想訓練一個 LLM 大模型時，則只需要一個 40 萬美元左右，消耗 0.13 千兆瓦時電力的 GPU 服務器即可。

換言之，相比 CPU 服務器，GPU 服務器能夠以 4% 的成本和 1.2% 的電力消耗來訓練一個 LLM，這將帶來巨大的成本節省。

根據 Trend Force 的數據，2022 年搭載 GP GPU 的 AI 服務器年出貨量佔全部服務器的比重接近 1%，2023 年在 ChatGPT 等人工智能應用加持下，AI 服務器出貨量有望同比增長 8%，2022~2026 年出貨量 CAGR 有望達 10.8%，以 AI 服務器用 GPU，主要以公司 H100、A100、A800（主要出貨中國）以及 AMD MI250、MI250X 系列為主，而英偉達與 AMD 的佔比約 8:2。

基於 IDC 預測 2026 年全球服務器出貨量 1877 萬台、AI 服務器的佔比逐年提升 1%，同時 AI 服務器中 GPU 的搭載數量逐年提升 0.5 個百分點、隨着 GPU 產品迭代，GPU 單價逐年提升 2000 美元，國金證券基於上述基礎預測，2026 年全球數據中心 GPU 市場規模有望達 224 億美元。