OpenAI's most powerful "Enterprise Edition" explodes onto the scene, will the B-side large model market be dominated by a single winner?

通用大模型→專業小模型？

速度翻倍、安全加密、調用 GPT-4 無上限，今天凌晨，OpenAI 官宣的企業專用版 ChatGPT 堪稱 “最強 ChatGPT 版本”！

同普通版 ChatGPT 相比，企業版性能更加強大，包括：提供無限制的 GPT-4 訪問，速度提升 2 倍，支持無限制高級數據分析，支持可用於 4 倍輸入和文件的 32k Tokens 上下文窗口，提供可共享的聊天模板和免費的 API 接口、保證企業的數據隱私和安全等。

除了目前適合大型企業的版本之外，OpenAI 還將很快推出適用於各類小型團隊的自助式 ChatGPT Business 產品，服務於所有規模和類型的組織。也就是説，從今天開始，OpenAI 已然吹響了向 B 端市場全面進攻的號角。

自然，這就帶來了一個問題：面向企業的 B 端 AI 大模型市場，會 “贏家通吃” 嗎？

最近，美國光速創投 (Lightspeed Venture Partners) 合夥人 Guru Chahal 深度分析了這一問題。

作者認為，B 端最有可能的路徑，是企業在探索階段使用大型模型，隨着在實際使用中對大模型理解的加深，逐漸轉向生產階段使用更小型、專業化（調整 + 精煉）的模型。

Chahal 還提到了企業在選擇模型時需要考慮的因素，以及 AI 基礎設施的發展機遇，包括評估框架、模型運行與維護、增強系統、運維工具、數據利用等各個方面。

文章乾貨很足，相信對想了解 B 端 AI 市場、AI 基礎設施、未來機遇等方面的朋友一定大有裨益。

以下為全文內容，大家 enjoy~✌️

● 大模型生態系統分類

● 將用例與模型匹配

● 未來機遇在何方

在過去的十數年裏，作為 Lightspeed 團隊一員，我親歷了人工智能和機器學習領域的驚人創新，這主要歸功於我們與卓越創業者的深度合作。

現在，我們與他們的公司、所構建的平台，以及服務的客户進一步合作交流，以便更系統地瞭解企業如何思考生成式 AI。

具體來説，我們深入探究了大模型生態系統，嘗試探討諸如 “性能最強大模型是否會贏家通吃？”、“企業在使用時是否會一味依賴 OpenAI 的 API，還是選擇更加多樣化的實際用例？” 這一類問題。

這些問題的答案，將決定該未來大模型生態系統的增長方向，以及算力、人才和資金的流向。

大模型生態系統分類

根據我們的研究，我們認為，人工智能領域正在經歷一次 “寒武紀式” 的模型大爆發。未來，開發者和企業將根據實際需求選擇最適合的模型，儘管在探索階段的使用的可能更加集中。

B 端最有可能的路徑，是企業在探索階段使用大型模型，隨着在實際使用中對大模型理解的加深，逐漸轉向生產階段使用更小型、專業化（調整 + 精煉）的模型。

下圖展示了我們對基礎模型生態系統演化的看法。

我們認為，人工智能模型領域可以分為三個主要、但又有些交叉的類別：

類別 1：巨腦模型

這些是最優秀的模型，也是模型領域的先驅。它們產生了令人驚歎的演示效果，深深吸引了我們的注意。當開發者試圖探索人工智能對其應用的潛力極限時，這些模型往往是默認的起點。

這些模型的訓練成本高，維護和擴展複雜。但同一個模型可以應對法學院入學考試（LSAT）、醫學院入學考試（MCAT），撰寫高中論文，並像聊天機器人朋友一樣與你互動。目前，開發者正在這些模型上進行實驗，並評估在企業應用中的人工智能使用情況。

需要注意的是，這些模型的使用成本高，推理延遲較大，並且在明確定義的受限用例中可能過於複雜。

同時，這些模型是通用模型，可能在專業任務上不夠準確（例如，參見康奈爾大學等的綜合研究）。

而且，它們也是黑匣子，可能給企業帶來隱私和安全挑戰，企業正在探索如何在不泄露數據的情況下利用這些模型。

OpenAI、Anthropic、Cohere 都屬於這一類別。

類別 2：挑戰者模型

這些模型同樣具有高能力，僅次於領先模型。Llama 2 和 Falcon 是這一類別中的佼佼者。它們通常與類別 1 模型中的 “N-1” 或 “N-2” 模型一樣優秀。

據某些基準測試，Llama 2 甚至與 GPT-3.5-turbo 相媲美。通過在企業數據上進行調整，這些模型在特定任務上的能力可與類別 1 中模型相當。

其中許多模型是開源的（或非常接近）。一旦發佈，它們往往會被開源社區迅速改進和優化。

類別 3：長尾模型

這些是 “專家” 模型。它們專為特定目標構建，例如對文件進行分類、識別圖像或視頻中的特定屬性、識別商業數據中的模式等。這些模型靈活，訓練和使用成本低，可以在數據中心或邊緣上運行。

僅需瀏覽 Hugging Face，即可窺見這一生態系統的廣度之大，未來還會因為它為各種用例提供服務而不斷擴大！

將用例與模型匹配

儘管尚處於早期階段，但我們已經看到一些領先的開發團隊和企業開始以這種精細的方式思考這個生態系統。他們渴望將用例與最適合的模型匹配，甚至可能在更復雜的用例中使用多個模型。

在選擇使用哪個/哪些模型方面，通常會考慮以下因素：

a. 數據隱私和合規要求，這會影響模型是在企業基礎架構中運行，還是數據可以發送到外部託管的推理終端。

b. 能否對模型進行微調對這個用例是否至關重要或者強烈希望進行微調。

c. 期望的推理 “性能” 水平（延遲、準確性、成本等）。

實際清單通常比上述內容更長，反映了開發者希望利用人工智能解決的各種多樣用例。

機遇在哪裏

這一新興生態系統產生了幾個重要影響：

① 評估框架：企業將需要工具和專業知識，來評估哪個模型適合哪個用例。

開發者需要決定如何最好地評估特定模型是否適合 “所需工作”。評估需要考慮多個因素，不僅包括模型性能，還包括成本、可以行使的控制水平等。

② 運行和維護模型：預計將出現用於幫助企業訓練、微調和運行模型的平台，特別是第三類長尾模型。

這些平台過去通常被稱為 ML Ops 平台，我們預計這個定義將擴展到包括生成式人工智能。Databricks、Weights and Biases、Tecton 等平台正在迅速朝這個方向發展。

③ 增強系統：模型，特別是託管的 LLM（檢索增強模型），需要通過增強生成提供卓越的結果。

這涉及做出次級決策，包括：

o 數據和元數據攝取：如何連接結構化和非結構化的企業數據源，然後攝取數據以及關於訪問策略等方面的元數據。

o 生成和存儲嵌入：選擇用於為數據生成嵌入的模型。然後，如何存儲這些嵌入：根據所需性能、規模和功能選擇哪個向量數據庫？

在這裏，存在機會來構建面向企業的 RAG（檢索增強生成）平台，以簡化選擇和組合這些平台所帶來的複雜性：

① 運維工具：企業 IT 部門需要為工程團隊建立監管措施，管理成本等。

與今天為軟件開發所做的所有工作一樣，他們需要擴展這些任務，以包括人工智能的使用。IT 感興趣的領域包括：

o 可觀測性：模型在生產環境中的表現如何？它們的性能是否隨時間改善/惡化？是否存在可能影響未來應用程序版本中模型選擇的使用模式？

o 安全性：如何確保 AI 本地應用程序的安全性。這些應用程序是否容易受到新的攻擊方式的攻擊，需要新的平台？

o 合規性：我們預計 AI 本地應用程序和 LLM 的使用將需要符合相關主管機構已開始制定的框架。這是除了隱私、安全、消費者保護、公平性等現有合規性制度之外的。企業將需要平台來幫助他們保持合規性、進行審計、生成合規性證明等相關任務。

② 數據：預計將迅速採用幫助企業瞭解其數據資產以及如何通過使用新型人工智能模型從這些資產中提取最大價值的平台。

正如地球上最大的軟件公司之一曾對我們説的那樣，“我們的數據是我們的壕溝，我們的核心 IP，我們的競爭優勢。”

通過利用人工智能將這些數據貨幣化，以一種在不削弱防禦能力的情況下推動 “差異化” 的方式，將是關鍵。Snorkel 等平台在其中發揮着關鍵作用。

我們認為，現在正是構建人工智能基礎設施平台的絕佳時機。

儘管人工智能的應用將繼續改變整個行業，但要想使每個企業都能採用這一強大技術，就需要支持基礎設施、中間件、安全性、可觀測性和操作平台。

本文來源：硬 AI