ChatGPT 火爆出圈 生成式 AI 平台,誰主沉浮?
基礎設施提供商可能是迄今為止市場上的最大贏家,創造最大價值的公司——即訓練生成式 AI 模型並將其應用在新的應用程序中的那些公司,尚未獲取最大的價值。
美國著名投資機構 A16Z 近日發表了一篇文章題為《Who Owns the Generative AI Platform?(生成式 AI 平台,誰主沉浮?)》,裏面包含幾個月以來對 AIGC 領域內大廠與初創公司的訪談調研和數據分析,可能是我最近看到對此類話題最客觀且詳實的討論。
從去年 Midjourney 火爆出圈,隨後一系列相關公司如 Stability.AI、Runway、Jasper.AI 等相繼得到資本的青睞,年底 ChatGPT 更是讓普通大眾看到了下一代 AI 技術可能帶來的 “魔法”,背後的技術平台 OpenAI 更傳言估值高達 290 億美金。
熱鬧之下,這篇文章給出了非常多公開整理和實際調研獲得的數據,並結合對上百家公司的真實訪談,得出的階段性結論——“目前,生成式 AI 領域似乎不存在任何系統性的護城河”,這一定程度上給大家 “潑了冷水”,但似乎又與很多投資人和從業者的困惑相符。
且看 A16Z 是如何將這個話題層層剖析,由淺入深,並在最後給出誠實也充滿希望的答案的,Enjoy!
我們已開始見證生成式 AI(AIGC)技術棧的興起。數以百計的初創公司正在湧入市場,開發基礎模型,構建人工智能原生的應用程序,並建立基礎設施和開發工具。
不像許多熱門的技術趨勢在市場跟上其步伐前就被過度炒作了,生成式 AI 的熱潮卻伴隨着極高的市場歡迎度以及真實的市場收益。
如 Stable Diffusion 和 ChatGPT 的模型們正在創造用户增長的歷史記錄,一些應用在發佈不到一年的時間裏就實現了 1 億美元的年營收。對照表明,AI 模型在某些任務上的表現優於人類好幾個數量級。
已有足夠的早期數據表明範式轉移正在發生。而我們尚未明確的關鍵問題是:這個市場中的價值將在哪裏積累?
過去一年裏,我們會見了幾十位生成式 AI 的從業者,他們有些是初創公司的創始人,有些在大公司中負責與生成式 AI 相關的工作。據我們觀察:
-
基礎設施提供商可能是迄今為止市場上的最大贏家,他們賺取了流經技術棧的大部分資金;
-
應用類公司的營收增長得非常快,但在留存率、產品差異化和毛利率上卻容易遇到瓶頸;
-
模型提供商雖然對這個市場而言不可或缺,但絕大多數都還沒有實現大規模的商業化。
換言之,創造最大價值的公司——即訓練生成式 AI 模型並將其應用在新的應用程序中的那些公司——尚未獲取最大的價值。
我們很難預測接下來將發生什麼,但我們認為,核心是理解技術棧的哪些部分真正具有差異化和壁壘。這將對市場結構(公司的橫向或縱向發展)和其長期價值的驅動因素(利潤率和留存)產生重大影響。
至今,除了經典的護城河之外,我們很難在技術棧中找到堅實的壁壘。
我們非常看好生成式 AI,相信它將對軟件行業和其他行業產生巨大的影響。這篇文章的目標是描繪出市場的驅動力,並嘗試回答和生成式 AI 的商業模式相關的更廣泛的問題。
高級技術棧:基礎設施、模型和應用

-
應用層:將生成式 AI 模型集成進面向用户的應用軟件,它們或運行着自己的模型(端到端應用),或依賴於三方模型的 API;
-
模型層:驅動 AI 產品的模型,它們要麼以專有 API 的形式提供,要麼開源提供(這種情況需要一個對應的託管解決方案);
-
基礎設施:基礎設施供應商(如雲廠商或硬件製造商),它們負載着生成式 AI 模型的訓練和推理。
第一波生成式 AI 應用邁向規模化 但留存率和差異化仍面臨困難
在之前的技術週期中,人們普遍認為要建立一個獨立的大企業,公司必須擁有終端客户——無論是個人消費者還是企業買家。因此人們更容易相信,生成式 AI 領域的最終贏家也會是面向終端的應用程序。而目前,生成式 AI 的探索之旅依然迷霧重重。
可以肯定的是,生成式 AI 應用程序的增速是驚人的,這得益於產品的新穎性和豐富的用户用例。
我們瞭解到至少有三類產品年營收已經超過了 1 億美元,即圖像生成、文案寫作和代碼編寫。
然而,僅靠高增長還不足以建立經久不衰的軟件公司。關鍵之處在於增長的背後必須有利可圖——從某種意義上説,用户一旦註冊,就會產生收益(高毛利),並長期留在應用中(高留存)。在技術缺乏差異化的情況下,B2B 和 B2C 應用多數通過網絡效應、數據沉澱和日益複雜的工作流來推動長期客户價值。
在生成式 AI 中,這些假設並不一定成立。
那些與我們交談過的應用軟件公司,毛利率落在一個很大的區間——少數情況下可高達 90%,但更多數情況僅有 50-60%,主要受限於模型推理成本。雖然用户漏斗頂端的增長十分驚人,但鑑於我們已經看見付費轉化和留存的開始下降,現有的獲客策略是否可規模化尚未可知。
由於依賴類似的數據模型,許多應用軟件在產品層面相差無幾,並且它們均尚未找到友商難以複製的顯著網絡效應、數據積累或獨特工作流。
因此,目前還無法明確直接銷售終端應用是否是構建生成式 AI 可持續商業模式的唯一甚至是最佳途徑。隨着語言模型的競爭加劇和效率提升,應用的利潤空間將會提高(下文將詳述),而後面 “白嫖黨” 會逐漸離場,產品的留存也可能有所提升。
一個強有力但仍待驗證的觀點是,縱向整合的應用(如上圖裏的 Midjourney)將在差異化上具有優勢。
展望未來,生成式 AI 應用公司將面臨的主要問題包括:
-
縱向整合(應用 + 模型):將 AI 模型視作一種服務,小型應用開發團隊可以快速迭代並隨着技術的演進替換模型供應商。另一方面,部分開發者認為模型就是產品本身,只有從頭開始訓練才能建立壁壘——即不斷對產品積累下來的專有數據進行訓練。這麼做的代價是燒更多的錢並犧牲部分產品團隊的靈活性。
-
構建功能還是應用:生成式 AI 的產品形態五花八門:桌面應用程序、移動應用程序、Figma/Photoshop 插件、Chrome 瀏覽器擴展應用甚至 Discord 機器人…在用户已經習慣的工作界面中集成 AI 通常比較容易,因為交互界面往往只是一個文本框。這些公司中的哪些將成長為獨立的公司,哪些又將被已有 AI 產品線的大廠(如微軟或谷歌)收入麾下,值得拭目以待。
-
設法穿越炒作週期(Hype cycle):用户流失究竟是因為產品自身的產品力不足還是早期市場的人為表現目前尚無定論,對生成式 AI 的濃厚興趣是否會隨着炒作的消退而淡去也暫時沒有答案——何時加速融資?如何激進地獲客?優先考慮哪些用户羣體?何時宣告 PMF 成功?這些問題對於應用程序類公司而言意義重大。
模型提供商發明了生成式 AI 但尚未實現大規模商業化
如果沒有谷歌、OpenAI 和 Stability.AI 等公司奠定了傑出的研究和工程基礎,我們現在所説的生成式 AI 將無從存在。創新的模型架構和不斷擴展的訓練管道使我們均受益於大語言模型(LLMs)和圖像生成模型的 “超能力”。
然而,這些公司的收入規模在其用量和熱度面前似乎不值一提。
在圖像生成方面,得益於其用户界面、託管產品和微調方法組成的操作生態,Stable Diffusion 已經見證了爆炸性的社區增長。但 Stability 仍將免費提供其主要檢查點作為核心業務宗旨(願景是開源)。
在自然語言模型中,OpenAI 以 GPT-3/3.5 和 ChatGPT 佔據主導地位,但到目前為止,基於 OpenAI 構建的殺手級應用仍相對較少,而且其 API 定價已經下調過一次。
這可能只是一個暫時的現象。Stability.AI 仍是一家尚未專注於商業化的新興公司,隨着越來越多殺手級應用的構建——尤其當它們被順利整合進微軟的產品矩陣,OpenAI 也有成長為龐然大物的潛力,屆時將吃走 NLP 領域一塊很大的蛋糕。當模型被大量使用,大規模的商業化自然水到渠成。
但阻力依然存在。開源模型可以由任何人託管,包括不承擔大模型訓練成本(高達數千萬或數億美元)的外部公司。是否有閉源模型可以長久地保持其優勢目前還是未知數。
我們看見由 Anthropic、Cohere 和 Character.ai 等公司自行構建的大語言模型開始嶄露頭角,這些模型和 OpenAI 基於類似的數據集和模型架構進行訓練,在性能上已經逼近 OpenAI。但 Stable Diffusion 的例子表明,如果開源模型擁有足夠高的性能水平和充分的社區支持,那麼閉源的替代方案將難以與其競爭。
如今,對專有 API(如 OpenAI)的需求正在迅速增長,託管可能是目前對模型提供商而言最明確的商業化路徑。
開源模型託管服務(如 Hugging Face 和 Replicate)正在成為便捷地分享和集成模型的有效樞紐——甚至在模型提供者和消費者之間產生了間接的網絡效應。模型提供商通過模型微調和與企業客户簽訂託管協議來變現,看上去是十分可行的。
除此之外,模型提供商將面臨的主要問題還包括:
-
商品化:人們普遍認為,AI 模型的性能將隨時間推移趨於一致。在與應用開發者的交談中,我們可以確定這種情況尚未發生,在文本和圖像模型領域都還存在實力強勁的領跑者。它們的優勢並非基於獨特的模型架構,而是源自大量的資本投入、專有的交互數據沉澱和稀缺的 AI 人才。但這些會是持久的優勢嗎? -
客户流失:依賴模型提供商是應用類公司起步甚至(早期)發展業務的絕佳方法。但當業務達到一定體量,這些公司就有動力構建或託管它們自己的模型。許多模型提供商的客户分佈高度不均衡,少數應用貢獻了絕大多數收入。一旦這些客户轉向自研 AI,對模型提供商將意味着什麼? -
錢重要嗎:生成式 AI 的未來是把雙刃劍,前景無比光明卻也潛在巨大危害,以至於許多模型供應商以共益企業(B corps)的模式組織成立,它們或發行有上限的利潤份額,或以其他方式明確地將公共利益納入公司使命。這些舉措絲毫不影響它們融資。但此處有一個合理的爭議——即多數模型提供商是否真的想要獲取價值,以及它們是否應該這麼做?
基礎設施供應商觸及一切 並採摘了果實
生成式 AI 中的近乎一切都會在某個時刻通過雲託管的 GPU(或 TPU)。無論是對於訓練模型的模型提供商和科研實驗室、執行推理和微調任務的託管公司或是兩者兼顧的應用程序公司,每秒浮點運算(FLOPS)都是生成式 AI 的命脈。這是很長時間以來第一次,最具顛覆性的計算技術的進步嚴重受限於計算量。
因此,生成式 AI 市場裏的大量資金最終流向了基礎設施公司。可以用一些粗算數字加以説明:
我們估計,應用程序公司平均將約 20-40% 的年收入用於推理和定製化的微調,這部分通常直接支付給雲服務提供商以獲取實例或支付給第三方模型提供商——相應地,這些模型提供商將大約一半的收入投入於雲基礎設施。
據此我們有理由推測,生成式 AI 總營收的 10-20% 將流向雲服務提供商。
除此之外,訓練着自有模型的初創公司們已經籌集了數十億美元的風險投資——其中大部分(早期階段高達 80-90%)通常也花在雲服務提供商身上。許多上市科技公司每年在模型訓練上花費數億美元,它們要麼與外部的雲服務提供商合作,要麼直接與硬件製造商合作。
這就是我們常説的 “一大筆錢”——尤其是對於一個新興市場而言。
其中大部分的錢都花在了三大雲上:AWS、谷歌雲(GCP)和微軟 Azure。三朵雲每年花費超千億美元的資本支出以確保它們擁有最全面、最可靠、最具成本優勢的雲平台。尤其在生成式 AI 領域,三朵雲還受益於有限的供給,因為它們可以優先使用稀缺的硬件(如英偉達的 A100 和 H100 GPU)。
眼下,我們看見該領域的競爭也開始出現。
甲骨文等挑戰者已經通過鉅額的資本支出和銷售激勵進軍市場;一些提供針對大模型開發人員提供解決方案的初創公司,如 Coreweave 和 Lambda Labs 也正在快速發展,它們在成本、可用性和個性化支持上展開角逐。
此外,初創公司還公開更細粒度的資源抽象(即容器),而受限於 GPU 虛擬化,大型雲廠商只提供虛擬機實例。
迄今為止,生成式 AI 領域最大的幕後贏家,可能是運行了絕大多數 AI 工作負載的英偉達(NVIDIA)。
該公司報告稱,2023 財年第三季度,其數據中心 GPU 的收入為 38 億美元,其中相當一部分用於生成式 AI 用例。通過數十年對 GPU 架構的投資、產學研深入合作以及軟硬件生態系統的構建,英偉達已圍繞該業務建立了堅固的護城河。
最近一項分析發現,研究文獻中引用英偉達 GPU 的次數是頂級 AI 芯片初創公司總和的 90 倍。
其他硬件選項確實存在,包括谷歌張量處理單元(TPU)、AMD Instinct GPU、AWS Inferentia 和 Trainium 芯片,以及來自 Cerebras、Sambanova 和 Graphcore 等初創公司的 AI 加速器。後發者英特爾(Intel)也帶着高端的 Havana 芯片和 Ponte Vecchio GPU 進入了這個市場。但到目前為止,仍然鮮有新芯片能夠佔據可觀的市場份額。
有兩個例外值得關注,一個是谷歌,其 TPU 在 Stable Diffusion 社區和谷歌雲平台的一些大型案例中表現出了巨大吸引力,另一個是台積電,據説它生產了以上所列舉的所有芯片,包括英偉達的 GPU(英特爾的芯片則由自有晶圓廠和台積電共同生產)。
換句話説,基礎設施可能是整個技術棧中可持續獲利且有壁壘的一層。基礎設施供應商需要回答的主要問題包括:
-
保持無狀態工作負載:無論在哪裏租用英偉達的 GPU 都是一樣的。大多數 AI 工作負載是無狀態的,從某種意義上説,模型推理無需附加的數據庫或存儲(除模型權重本身外)。這意味着 AI 工作負載可能比傳統應用程序的工作負載更易於跨雲遷移。在這種情況下,雲服務提供商應如何創造用户粘性,防止客户轉向便宜的選擇?
-
芯片荒終結後的較量:雲服務提供商和英偉達產品的定價都是基於最理想的 GPU 目前供給稀缺。一位供應商告訴我們,A100 的售價自發布以來有所上漲,這對於計算硬件而言是極不尋常的。若通過增加產量和/或採用新的硬件平台可最終消除芯片的供給限制,雲服務提供商將受何影響?
-
挑戰者能否破局:我們堅信,垂直雲將通過提供更加專業的服務從三朵雲手中奪取市場份額。到目前為止,在 AI 領域,部分挑戰者通過適度的技術差異化和英偉達的支持已經獲得了一定的市場吸引力——對英偉達而言,現有的雲服務提供商既是最大的客户,也是新興的競爭對手。但長期的問題是,這些助力是否足以幫助新興雲廠商攻克三朵雲的規模優勢?
價值最終將在哪裏積累?
顯然,我們還不知道答案。但結合生成式 AI 的早期數據和我們關於 AI/ML 初創公司的經驗,我們有以下直覺:
如今,生成式 AI 領域似乎不存在任何系統性的護城河。
由於基於相似的模型構建應用,應用程序提供商缺乏顯著的的產品差異。其次,由於模型基於相似架構和相似的數據集訓練而來,模型提供商長期可能會趨於一致。最後,由於運行同樣的 GPU,甚至硬件公司在相同的晶圓廠生產芯片,雲服務提供商缺乏深度的技術差異。
當然,老生常談的護城河依然存在,比如:規模護城河(我能比你融到更多的錢!),供應鏈護城河(我擁有你所沒有的 GPU!),生態護城河(所有人都已經在使用我的軟件),算法護城河(我們比你更聰明!),分發護城河(我已經組建了銷售團隊並且客户數比你多!)以及數據管道護城河(我在互聯網上爬取了比你更多的信息!)。
但長期而言,這些護城河並不可持續。強大的網絡效應是否會在生成式 AI 技術棧中的任何一層佔據上風?現在下定論,一切還為時過早。
根據現有數據,我們很難判斷,生成式 AI 長期是否會形成贏者通吃的局面。
這很不尋常,但對我們而言是個好消息。這個市場的潛在規模難以把握——它介於所有軟件和所有人類的努力之間——因此我們預計將有許多玩家參與到技術棧各個層級的有序競爭中。
我們也希望公司無論橫向延展或是縱向深耕都能取得成功,為終端市場和終端用户提供最佳解決方案。舉例來説:
-
如果終端產品的差異化源自 AI 本身,那麼縱向深耕(即緊密耦合面向用户的應用和自研模型)可能會取勝;
-
如果 AI 屬於一個更大的長尾功能組合,那麼橫向延展將更可能發生。隨着時間的推移,我們將看見更多典型護城河的建立——甚至可能見證新型護城河的誕生。
無論如何,有一件事我們可以確定,生成式 AI 正在改變這場遊戲,而我們都在與時俱進地學習着遊戲規則。大量價值將被 AI 釋放,科技領域終將發生翻天覆地的變化。
此刻,我們正在這浪潮之上,擁抱生成式的新未來!
本文作者:我思鍋我在 GN,本文來源:我思鍋我在,原文標題:《A16Z:生成式 AI 平台,誰主沉浮?| AIGC 101》