“反覆橫跳” 馬斯克也要做大模型了?

華爾街見聞
2023.04.12 09:00
portai
I'm PortAI, I can summarize articles.

媒體報道稱,儘管馬斯克剛剛簽署公開信呼籲暫停先進人工智能研究六個月。但事實上,他卻在 “暗中” 推進新的生成式人工智能項目,併為此購買了上萬個 GPU。

前腳剛剛呼籲暫停 AI 開發至少 6 個月,後腳馬上 “暗中” 購買上萬個 GPU 推進 AIGC 項目,“整活王” 馬斯克又搞事情了。

據 Business Insider 當地時間 4 月 11 日報道,兩位知情人士透露,儘管馬斯克此前剛剛簽署公開信。但事實上,他卻在 “暗中” 推進新的生成式人工智能(AIGC)項目,併為此購買了上萬個 GPU(圖形處理器)。

據 Business Insider 消息,這 1 萬顯卡是買給推特的,推特版 GPT已在準備中,而且推特本身就擁有海量數據,存在一定優勢,該項目涉及創建一個生成式人工智能,推特將根據自己的海量數據進行訓練。

至於推特 GPT 究竟作用在何處,市場人士有兩種猜測:

其一,改進搜索。

因為馬斯克曾抱怨過這一功能,甚至還聘請過著名 iPhone 黑客 George Hotz 進行為期三個月的修復。不過似乎他和馬斯克的 “氣場不和”,不僅曾經拒絕了特斯拉的 offer 邀請,在推特本來説好的三個月,也只呆了一個月就走了。

其二,可能是廣告營銷。

廣告是社交媒體的支柱,馬斯克在收購推特之後搞了很多新政策,不少廣告商直接削減支出或乾脆不合作了,導致光是推特去年 12 月的收入就比同期下降了約 40%。

而如果有了大模型來做生成式 AI 創作,無論是設計素材還是提供 idea,都可能會提高推特在廣告營銷方面的效率和收益。

馬斯克與 OpenAI 的愛恨情仇

今年 3 月,在 GPT-3.5 迭代到 GPT-4,兩個月就獲得 1 億活躍用户後,馬斯克等科技圈大佬帶頭潑下冷水,他們發佈了一封聯名公開信,呼籲所有 AI 實驗室立即暫停訓練比 GPT-4 更強大的 AI 系統至少 6 個月。

而一眾大佬的叫停理由是:“希望暫停研發比 GPT-4 更強大的 AI 至少 6 個月,AI 可能對社會和人類構成潛在風險;近期各人工智能實驗室陷入了失控的研發競爭,如果不能立即暫停,呼籲政府可以介入。

現在問題就來了,前腳剛剛呼籲暫停研發,後腳自己馬上就動手搞了,為什麼馬斯克態度如此反覆?

據媒體報道,實際上,馬斯克反對的可能不是 AI,而是 OpenAI 和 GPT。

據新興媒體 Semafor 透露,馬斯克與 OpenAI 的不和更多是出於個人原因。2018 年,馬斯克告訴 OpenAI 的聯合創始人山姆·奧特曼,該實驗室落後於谷歌太多。馬斯克建議自己應該是經營公司的人,奧特曼和 OpenAI 的其他創始人拒絕了這一提議,權力鬥爭導致馬斯克離開 OpenAI。

不過美國《財富》雜誌當時報道稱,離開的原因是因為馬斯克雖然支持人工智能,但特斯拉智能駕駛技術與 OpenAI 之間有 “潛在利益衝突”。

在公司創立之初,馬斯克承諾向 OpenA 提供大約 10 億美元,而據 Semafor 的報道,該資助在他離開後就停止了。

此外,自 ChatGPT 誕生以來,馬斯克也沒少"針對"OpenAI。

例如其在推特上曾表示,“我捐 1 億美金成立的非營利組織怎麼就變成一個 300 億市值的營利性公司了呢?如果這是合法的,為什麼其他人不這樣做?”

此外,在過去 OpenAI 是可以使用推特數據進行 AI 訓練的,但 ChatGPT 發佈的第 5 天,馬斯克就下令暫停了這個權限。

算力需求將持續爆發

吃瓜歸吃瓜,最後我們重點再來聊一下算力的問題。

此次馬斯克購買的 1 萬張 GPU 大概是個什麼概念?事實上,特斯拉最強超算 Dojo 也沒有這麼多,Dojo 在 2022 年升級後公佈的數據是 7360 塊 A100,雖然這次買的什麼型號還不清楚,但光從數量來説也着實不少。

另外,據 ARKInvest 預測,ChatGPT-4 參數量最高達 15000 億個,由於參數量與算力需求間存在正比關係,所以可推算 GPT-4 算力需求最高達到 31271 PFlop/s-day。

浙商證券表示,與此同時,國內外廠商加速佈局大模型,其參數量均達到千億級別,同步帶動算力需求爆發式增長。

華安證券還提到,類 chatGPT 大模型帶來的算力增長,毋庸置疑,但算力的需求,不止侷限於模型的投資初期,隨着 GPTAPI 的開放、下游應用多模態的成熟,對於的大模型的推理算力需求進一步提升。即在模型不斷更迭訓練中,算力需求提升;在模型應用推理中,算力需求進一步提升。由此,整個算力需求一如互聯網時期的流量需求,持續爆發。

其表示,整個大模型的算力需求包括訓練端與推理端。具體來看:首先是訓練端:算力需求,與模型參數、訓練數據集規模正相關。

其表示,未來的訓練端算力需求將是下述三大因素的乘積。

1) 參數規模。也即隨着 GPT 3 向更多參數的 GPT4、5 等發展。

2) 訓練集規模。

3) 投入大模型的企業增長。國內包括華為、百度、阿里巴巴、騰訊、字節等互聯網巨頭以及更多加入大模型研發的企業。

而在推理端:算力需求與模型參數數量、平均序列長度、併發需求量正相關。其表示,多模態之下,圖片、視頻生成需求的提升,在公式中將會增加平均序列長度,同時隨着併發需求的增長,整個推理算力需求大幅提升。同時 chatgpt 應用進一步豐富,在推理端的算力需求持續提升,或將遠遠超過訓練階段的算力需求。

風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。