中國的 DeepSeek AI 模型震驚世界:你是否應該賣掉你的英偉達股票?

Motley Fool
2025.01.27 17:02
portai
我是 PortAI,我可以總結文章信息。

英偉達在 GPU 市場的主導地位可能受到中國 DeepSeek AI 模型 R1 的威脅,該模型在成本僅為 OpenAI 的 o1 模型的一小部分的情況下,已經達到了或超過了 o1 的性能。DeepSeek 是一家來自對沖基金的初創公司,利用創新技術和優化硬件開發了 R1,使其能夠在有限的資源下生成先進的 AI 模型。這可能會減少對英偉達高成本 GPU 的需求,令英偉達和其他 AI 領導者感到擔憂。DeepSeek 獨特的方法和具有成本效益的解決方案可能會顯著擾亂當前的 AI 格局

英偉達(NVDA -16.70%)的神奇兩年之旅是否即將結束?到目前為止,市場對英偉達最新最強大的圖形處理單元(GPU)的需求一直是無法滿足的。隨着人工智能競爭的加劇,大型科技公司和初創企業紛紛爭相購買或租賃儘可能多的英偉達高性能 GPU,以期創造出更好的模型。

但上週,中國人工智能初創公司 DeepSeek 發佈了其 R1 模型,震驚了科技界。R1 是一個 “推理” 模型,其性能與 OpenAI 剛剛在 12 月初發布的 o1 推理模型相匹配或超越,但成本卻低得多。

能夠在有限的計算資源下生成前沿的大型語言模型(LLM),可能意味着未來人工智能公司不再需要購買或租賃如此高成本的計算資源。這對英偉達和去年的人工智能贏家來説,後果可能是毀滅性的。

但一如既往,真相更加複雜。

什麼是 DeepSeek?

DeepSeek 是從一家名為 High-Flyer 的量化對沖基金中分拆出來的人工智能實驗室。首席執行官梁文峯於 2015 年創立了 High-Flyer,並在 2023 年 ChatGPT 震撼發佈後開始了 DeepSeek 的創業。

自那時起,DeepSeek 一直在構建人工智能模型,報道稱在限制之前購買了 10,000 個英偉達 A100,這些是當前 Blackwell 芯片的前兩代產品。DeepSeek 還 reportedly 擁有一組英偉達 H800,這是一種為中國市場設計的受限或減速版本的英偉達 H100。值得注意的是,H100 是英偉達在最近推出 Blackwell 之前的最新一代 GPU。

R1 震驚世界

1 月 20 日,DeepSeek 發佈了其基於 V3 LLM 的首個 “推理” 模型 R1。推理模型相對較新,使用一種稱為強化學習的技術,基本上推動 LLM 沿着思維鏈條前進,如果遇到 “牆”,則會回退,然後探索各種替代方法,最終得出答案。因此,推理模型能夠比直接問答模型更精確地回答複雜問題。

令人難以置信的是,R1 在多個基準測試中能夠達到或甚至超越 OpenAI 的 o1,同時據稱訓練成本僅為一小部分。

我們談論的成本到底有多低?R1 的論文聲稱該模型的訓練相當於僅花費 560 萬美元的租賃 GPU 小時,這與 OpenAI 和其他美國領先公司據稱花費的數億美元相比,實在是微不足道。DeepSeek 的收費大約是 OpenAI 的 o1 運行成本的三十分之一,而梁文峯則表示 DeepSeek 的收費僅是 “略有盈利”。專家估計,Meta Platforms(META 1.89%)的 Llama 3.1 405B 模型運行成本約為 6000 萬美元的租賃 GPU 小時,而 V3 的成本僅為 600 萬美元,儘管 V3 在各種基準測試中超越了 Llama 的最新模型。

DeepSeek 是如何做到的

根據 Kevin Xu 的一篇信息豐富的博客文章,DeepSeek 能夠實現這一小奇蹟,得益於三個獨特的優勢。

首先,梁文峯將 DeepSeek 構建為一種理想主義的人工智能研究實驗室,沒有明確的商業模式。目前,DeepSeek 對希望在其基礎上構建產品的其他公司收取少量費用,但否則其開源模型是免費提供的。梁文峯還招募了大量剛從學校畢業或在中國頂尖大學攻讀博士學位的年輕人。這導致了一個自由實驗和試錯的文化,沒有太大的期望,使 DeepSeek 與中國的科技巨頭區分開來。

其次,DeepSeek 使用自己的數據中心,這使其能夠為自己的目的優化硬件機架。

最後,DeepSeek 能夠以多種方式優化其學習算法,這些方法結合在一起,使 DeepSeek 最大化其硬件的性能。

例如,DeepSeek 從零開始構建了自己的並行處理算法,稱為 HAI-LLM 框架,優化了其有限數量芯片的計算工作負載。DeepSeek 還使用 F8 或 8 位數據輸入框架,這是一種比 F32 精度更低的框架。雖然 F8“精度較低”,但它在內存利用率上節省了大量空間,而 R1 的其他過程也能夠通過更多高效的計算來彌補精度的不足。DeepSeek 還優化了其負載平衡網絡內核,最大化每個 H800 集羣的工作量,以確保沒有硬件 “等待” 數據。

這些只是 DeepSeek 能夠以更少的資源做更多事情的一些創新。但將所有這些 “黑科技” 結合在一起,導致了性能的顯著提升。

對英偉達的負面影響是,像 DeepSeek 這樣在軟件層面進行創新的人工智能公司,可能會減少對硬件的依賴,這可能會影響英偉達的銷售增長和利潤率。

圖片來源:Getty Images。

對於末日論的反駁

儘管 R1 對英偉達來説似乎是個壞消息,但對於英偉達 “註定要失敗” 的論點還有幾個反駁。

首先,有人對這家中國初創公司在成本估算上是否完全坦誠表示懷疑。根據機器學習研究員 Nathan Lampbert 的説法,560 萬美元的租用 GPU 小時數可能沒有考慮到一些額外成本。這些額外成本包括在訓練大型模型之前的顯著預訓練小時數、購買 GPU 和建設數據中心的資本支出(如果 DeepSeek 確實建立了自己的數據中心而不是從雲服務租用),以及高昂的能源成本。此外,還有 DeepSeek 的工程師薪資問題,因為 R1 有 139 名技術作者。由於 DeepSeek 是開源的,並非所有這些作者都可能在公司工作,但許多人可能確實在公司工作,並獲得足夠的薪水。

Lampert 估計 DeepSeek 的年度運營成本可能接近 5 億到 10 億美元之間。這仍然遠低於其美國競爭對手的成本,但顯然高於 R1 論文提出的 600 萬美元。

還有一些人簡單地懷疑 DeepSeek 在芯片獲取方面是否坦誠。在最近的一次採訪中,Scale AI 首席執行官 Alexandr Wang 告訴 CNBC,他認為 DeepSeek 擁有一個 50,000 H100 集羣,但並未披露,因為根據 2022 年的出口限制,這些芯片在中國是非法的。

然而,考慮到 DeepSeek 已經公開發布了其 R1 模型的技術,研究人員應該能夠在有限的資源下複製其成功。目前看來,R1 的效率突破似乎更真實。

即使是真的,英偉達也未必完蛋

雖然 DeepSeek 無疑令人印象深刻,但前 OpenAI 高管 Miles Brundage 也警告不要對 R1 的首次亮相過於解讀。Brundage 指出,OpenAI 已經推出了其 o3 模型,並很快將推出 o5 模型。雖然 DeepSeek 能夠通過新穎的技術成功實現 R1,但其有限的計算能力可能會減緩其擴展和從第一個推理模型中進步的速度。

Brundage 還指出,有限的計算資源將影響這些模型在現實世界中同時執行的能力:

即使這是在保持智能的情況下最小化的版本——已經提煉的版本——你仍然希望在多個現實世界應用中同時使用它。你不會想在改善網絡能力、幫助做作業或解決癌症之間做出選擇。你希望同時做所有這些事情。這需要並行運行多個副本,生成數百或數千個解決困難問題的嘗試,然後選擇最佳解決方案。... 為了做一個人類與 AI 的類比,可以考慮愛因斯坦或約翰·馮·諾依曼作為你可以放入人腦中的最聰明的人。你仍然希望有更多的他們。你希望有更多的副本。這基本上就是推理計算或測試時計算——複製聰明的東西。擁有一個小時的愛因斯坦時間總比一分鐘要好,我看不出這對 AI 來説會有什麼不同。

傑文斯悖論

最後,投資者應牢記傑文斯悖論。這個術語由英國經濟學家威廉·斯坦利·傑文斯在 1865 年提出,涉及煤炭使用,這是當技術過程變得更高效時發生的現象。根據傑文斯悖論,如果一種資源的使用效率提高,而不是看到該資源使用量的減少,消費量反而會呈指數增長。增加的需求通常會超過所獲得的效率,從而導致對該資源的總體需求增加。

對於 AI 來説,如果訓練先進模型的成本下降,可以預見 AI 將在我們的日常生活中被越來越多地使用。根據這一悖論,這實際上應該會增加對計算能力的需求——儘管可能更多是用於推理而不是訓練。因此,這可能會奇怪地使英偉達受益。另一方面,據信 AI 推理可能相對於訓練對英偉達的競爭更為激烈,因此這可能是一個負面因素。但這個負面因素將源於更多的競爭,而不是計算需求的減少。

底線是,未來幾年對 AI 計算的需求應該會持續大幅增長。畢竟,在 1 月 24 日,Meta Platforms 首席執行官馬克·扎克伯格宣佈 Meta 將建設一個幾乎與曼哈頓一樣大的 AI 數據中心,並將其資本支出提高到 600 億到 650 億美元的範圍,遠高於 2024 年 380 億到 400 億美元的範圍。

這一公告是在 DeepSeek 發佈四天後發佈的,因此扎克伯格不可能不知道這一點。然而,他仍然認為 AI 基礎設施支出的巨大 50% 以上的增長是合理的。

毫無疑問,DeepSeek 的出現將對 AI 競賽產生影響。但與其説這是對英偉達和其他 “七大巨頭” 公司的 “遊戲結束”,不如説現實會更加複雜。

隨着 AI 競賽的推進,投資者將不得不評估哪些公司擁有真正的 AI“護城河”,因為 AI 商業模式以驚人的速度和意想不到的方式發展,正如 DeepSeek R1 剛剛展示的那樣。