DeepSeek Isn't the Only Low-Cost AI Startup. Here's What It Means for OpenAI and Nvidia.

Motley Fool
2025.01.31 11:31
portai
I'm PortAI, I can summarize articles.

DeepSeek 是一家中國的人工智能研究實驗室,已以美國公司如 OpenAI 和 Nvidia 成本的一小部分開發出具有競爭力的大型語言模型(LLMs)。其 V3 模型的開發成本為 560 萬美元,挑戰 OpenAI 的產品,而後者的成本約為 200 億美元。美國對 Nvidia 最新 GPU 的禁令促使 DeepSeek 在較低性能的硬件和高效算法上進行創新。這種走向商品化的趨勢可能會威脅到 OpenAI 的市場地位,而儘管 GPU 在訓練中的需求減少,Nvidia 可能會因較低的推理成本而受益

DeepSeek 是一家總部位於中國的人工智能(AI)研究實驗室。它於 2023 年從中國最成功的對沖基金 High-Flyer 分拆而出。該基金多年來一直在利用人工智能開發交易算法。

DeepSeek 團隊找到了一種方法,以美國領先的人工智能公司花費的極小一部分資金開發出強大的大型語言模型(LLMs)。這在週一引發了美國股市的恐慌,投資者考慮到對芯片供應商如 Nvidia(NVDA 0.77%)和知名開發者如 OpenAI(由 Microsoft 支持)的影響。

這可能是人工智能競賽中的一個變革性時刻。DeepSeek 的方法不僅可能有效,而且至少還有一家中國人工智能初創公司似乎也取得了類似的成果。這對 Nvidia 和 OpenAI 意味着什麼呢?

圖片來源:Getty Images。

人工智能模型正迅速商品化

Ilya Sutskever 是美國領先的人工智能開發公司 OpenAI 的聯合創始人之一。他曾認為數據和計算能力是訓練最佳人工智能模型和生產最智能人工智能軟件的關鍵成分。這被稱為預訓練擴展,這意味着擁有最多財力的開發者可以建立最佳的數據中心,購買最佳的芯片,從而贏得人工智能競賽。

但在 2024 年 11 月,他告訴路透社,使用該方法的結果已經停滯。OpenAI 此後開發了具有更好 “推理” 能力的模型,這意味着它們花更多時間 “思考”,以從 ChatGPT 聊天機器人中產生最佳響應。這被稱為測試時擴展,使用該方法的模型(GPT-4o1 到 GPT-4o3)在解決問題方面表現更好,並在學術層面上使人工智能更接近人類智能。

OpenAI 花費了約 200 億美元才達到這一點(這筆錢主要是自 2015 年以來從投資者那裏籌集的)。但 DeepSeek 最近發佈了其 V3 模型,僅花費 560 萬美元,卻在多個性能基準上與 OpenAI 的 GPT-4o 模型競爭。

美國政府禁止 Nvidia 向中國人工智能公司出售其最新的圖形處理器(GPU),因此 DeepSeek 使用了像 H100 和 H800 這樣的低功率版本開發 V3。為了彌補性能不足,DeepSeek 不得不在軟件方面進行創新,創造出更高效的算法和數據輸入方法。

該公司還使用了一種稱為蒸餾的技術來創建 V3。它涉及使用成功模型(如 GPT-4o1)訓練一個小模型,以產生類似的最終產品。這一策略大大加快了人工智能公司訓練競爭性 LLM 的速度,並可能導致商品化。換句話説,未來市場上可能會有數百個具有類似能力的 LLM,它們大多是可以互換的。

這可能對 OpenAI 甚至 Nvidia 構成真正的威脅。OpenAI 可能會失去其憑藉可觀財力建立的優勢,而由於對 LLM 訓練的需求減少,Nvidia 可能會遭受 GPU 需求下降的影響。

DeepSeek 以低成本震撼科技行業,但並非孤軍作戰

訓練只是方程式的一部分。還有推理過程,涉及人工智能模型將提示轉化為準確響應。但與任何業務一樣,整體成本降低可以轉化為客户的價格降低。

截至目前,DeepSeek 僅收取每百萬個輸入標記 0.14 美元,這比 OpenAI 每百萬個輸入標記 2.50 美元的收費便宜 94%(輸入標記是根據用户提示中的單詞數量計算的)。

但 DeepSeek 並不是唯一一家似乎破解了這一代碼的人工智能實驗室。曾在 Alphabet 的 Google 中國業務負責運營的李開復,推出了一家名為 01.ai 的人工智能初創公司。根據其網站,其 Yi 模型在與 DeepSeek 的競爭模型相比時表現良好。該公司僅收取每百萬個輸入標記 0.10 美元,甚至比其中國競爭對手更便宜——而且遠低於 OpenAI 的價格。

這一切對 OpenAI 和 Nvidia 意味着什麼

我認為如果 LLM 繼續朝着商品化趨勢發展,OpenAI 將面臨麻煩。此外,其模型是閉源的,因此開發者被鎖定在公司的生態系統中,這在競爭性開源 LLM 廣泛可用時將不是一個理想的特性。

相比之下,DeepSeek 採用開放源代碼的方法,使開發者可以根據需要自由調整其模型以構建人工智能軟件。開發者還可以在本地下載開源模型,因此他們無需與創建者共享敏感數據。

但儘管 OpenAI 面臨不確定性,Nvidia 可能實際上會從推理成本的下降中受益,這可能抵消部分在訓練方面失去的 GPU 需求。

想想手機的發展。當我們每次發送短信或瀏覽互聯網都需要支付費用時,我們並沒有像現在這樣頻繁使用手機。無限計劃提供無限的通話、短信和數據,使我們每天可以花幾個小時在手機上,只需支付名義上的月費——簡單來説,當成本降低時,使用量激增。

人工智能可能會走上類似的道路,隨着使用量的增加,公司將需要更多 Nvidia 的 GPU 來滿足推理的需求。尤其是在推理能力不斷發展的情況下,因為更多的思考需要顯著更多的計算能力。

短期內的情況則稍顯不確定。Nvidia 的一些客户會不會像 DeepSeek 那樣優化他們的訓練方法,從而減少數據中心的支出?這很難説,但新的季度財報季剛剛開始,因此我們應該在接下來的幾周內從幾乎每一家公司那裏收到更新。