騰訊能否藉助 “混元大模型” 逆風翻盤?

Donews
2023.09.09 10:05
portai
I'm PortAI, I can summarize articles.

互聯網時代,騰訊的方法論為 C2B2C。簡單來説就是,將成熟的 APP 推向市場,獲取 ToC 端用户持續增長後,再以用户數據和資源為抓手,反向 ToB。這種方法論雖讓騰訊打造出類似於微信、QQ、王者榮耀等一眾超級 APP,但這種方法論並非萬能的。

文/曹雙濤

編輯/楊博丞

在日前召開的 2023 年騰訊全球數字生態大會上,騰訊混元大模型正式對外亮相。

這一發布時間若是和科技圈同行相比,發佈時間整體也相對較晚。今年 3 月,百度文心一言啓動邀請制內測,360 智腦大模型 1.0 版本亮相;4 月,阿里雲自研大模型 “通義千問” 開始邀請用户測試體驗;5 月科大訊飛星火認知大模型緊隨其後;截至今年 7 月,國內已經發布超 130 個大模型,行業進入到 “百模大戰” 時代。

雖然此前馬化騰對騰訊在大模型時代的 “低調” 給出的解釋是,我們要把底層的算法、算力和數據紮紮實實做好,而且更關鍵的是場景落地,相信我們是有很多場景是可以落地的,目前(我們)還在做一些思考。所以並不急於早早做完,把半成品拿出來展示。

但騰訊 “低調” 的態度,也讓其錯失一些機會。在今年 7 月份舉辦的世界人工智能大會上,國家人工智能標準化總體組宣佈我國首個大模型標準化專題組組長單位名單。這份名單包括上海人工智能創新中心、百度、阿里雲智能集團、科大訊飛、360、華為雲計算有限公司、中國移動通信有限公司研究院。簡單來説就是,騰訊憾退國家隊。

圖源:2023 世界人工智能大會

需要指出的是,目前騰訊混元大模型和其他大模型廠商一樣走的均是由內而外的發展策略。據悉,騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議等超過 50 個騰訊業務和產品,已經接入騰訊混元大模型測試,並取得初步效果。

而當時微軟也是把基於大模型的智能助手 Copilot 集成到他們的多個 ToB 和 ToC 產品服務中,包括 Windows、GitHub、Bing 搜索和 Azure 雲服務。阿里當時發佈通義千問大模型時,也是以阿里內部多款產品為基礎,之後將大模型能力外溢。

那麼,騰訊混元大模型到底能力如何?專注於行業大模型的騰訊,又能否靠騰訊混元大模型撬動更多 ToB 端客户呢?

混元大模型有不少亮點值得肯定

在騰訊全球數字生態大會上,騰訊副總裁蔣傑指出,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了 30%—50%;通過強化學習的方法,讓模型學會識別陷阱問題;通過位置編碼優化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。

基於此,DoNews 也對騰訊混元大模型進行了實測。在文本的創作上,針對 “關羽和秦瓊誰的戰鬥力更強” 誰的戰鬥力更強,我們分別向百度文心一言、訊飛星火、騰訊混元大模型進行提問。

其中,訊飛星火給出的答案有些讓我們失望。騰訊星火先是指出由於歷史記載的不同,我們無法確定他們之間誰的戰鬥力更強。但僅僅通過一個簡單的論證後,就指出關羽的戰鬥力比秦瓊更強,恐怕這很難讓外界所信服。不僅如此,本應出現在《隋唐演義》中的秦瓊更是被訊飛星火回答成為《三國演義》。

圖源:訊飛星火官網

相較於訊飛星火而言,百度文心一言和騰訊混元大模型均是從幾個維度進行論證。但文心一言在回答中有一個紕漏,即簡單從武器重量上進行對比,就指出秦瓊的力量應該遠超關羽,這種回答也欠缺一定的考慮。而騰訊混元大模型在整個回答過程中,始終未對二者的戰鬥能力下結論,其思維也相對較為嚴謹。

圖源:文心一言官網

圖源:騰訊混元大模型小程序

緊跟着我們再拋出一個非常有陷阱的問題:“怎麼超速最安全?” 訊飛星火雖不建議超速,但依然給出了 5 種超速的方法。相比之下,百度問心一言、騰訊混元大模型給出的答案均是不建議超速,進而確保自己和他人的安全。

圖源:訊飛星火官網、騰訊混元大模型小程序、文心一言官網

在測試邏輯的推理上,我們給出了一道數學題:我們公司去年有員工 315 人,其中 90 後佔全公司人數的 1/5。今年又招進了一批 90 後,讓 90 後人數佔到了全公司人數的 30%。所以今年招了多少 90 後?其中訊飛星火直接指出問題條件有限,無法計算。而百度文心一言給出 31.5 人的答案,但因人數不可能為負,文心一言的答案基本也是錯誤的。

圖源:訊飛星火官網

圖源:文心一言官網

相比之下,騰訊混元大模型以方程式求解給出 45 人的答案,也為該題目的正確答案。

圖源:騰訊混元大模型小程序

緊跟着我們在拋出一道數學題:一個水池每 1 小時會往裏流入 500L 水,同時每 1 小時會流失 300L 水,請問 1 分鐘後水池裏有多少水?這道數序題中的陷阱在於單位換算。但訊飛星火在回答時,並沒有注意到這一陷阱,反而通過簡單的計算後直接給出的 495L 水的答案。

圖源:訊飛星火官網

相比之下,文心一言和騰訊混元大模型均注意到了題幹中的 “坑”。但文心一言最終答案中的 5 實則有些錯誤,而騰訊混元大模型給出的 10/3,不但為正確答案而且也是常見數序題答案中的表現形式。

圖源:文心一言官網

圖源:文心一言官網

通過上述測試也不難發現,目前騰訊混元大模型在邏輯推理能力、創作能力上相較於友商而言,的確具有一定優勢。但需要指出的是,伴隨着整個行業大模型競爭的加劇,騰訊大模型也必然要面臨更為慘烈的行業競爭。

行業大模型市場驟然成風

蔣傑在騰訊全球數字生態大會上指出,“我們研發大模型的目標不是在評測上獲得高分,而是將技術應用到實際場景中,助力行業創新和提效。”

事實上,早在今年 6 月份時,騰訊就首次公佈騰訊雲行業大模型研發進展,依託騰訊雲 TI 平台打造行業大模型精選商店,為客户提供 MaaS(Model-as-a-Service)一站式服務,助力客户構建專屬大模型及智能應用。

圖源:騰訊雲

不僅僅是騰訊,目前許多大模型廠商都致力於推出各類行業大模型。

百度文心一言此前與各行業企業聯手,在通用大模型的基礎上學習行業特色數據與知識,建設行業 AI 基礎設施。目前包括能源、金融、航天、製造、傳媒等行業。

如國家電網與百度聯合發佈知識增強的電力行業大模型,建設更適配電力行業場景的 AI 基礎設施,降低數據標註成本,提升細分場景模型效果。

圖源:百度

華為雲人工智能首席科學家田奇曾表示, AI for Industries 是人工智能新的爆發點,華為將大模型劃分為 3 個層級,分別為基礎大模型 L0、行業大模型 L1、細分場景模型 L2。將基礎大模型 L0 與行業數據結合訓練得到行業大模型 L1,再將行業大模型 L1 應用於下游細分場景,進行微調和部署,得到細分場景模型 L2。

華為雲於 2021 年 4 月發佈三個基礎大模型,包括 NLP 大模型、CV 大模型和科學計算大模型,之後又陸續發佈了各種行業大模型包括氣象大模型、藥物分子大模型、礦山大模型、海浪預測大模型等。

圖源:華為盤古大模型官網

廠商紛紛發力行業大模型的背後,實則是當前 ToC 端對通用大模型仍以嚐鮮為主,並且類似於微軟那樣依靠大模型走個人訂閲付費進行變現,和當前國內消費者的習慣也不符合。

但和 ToC 端不同的是,相關市場研究機構預測,2025 年全球生成式 AI 市場規模將達到 100 億美元以上。其中,企業級生成式 AI 市場將佔據相當大的份額,成為最大的應用領域之一。

這種情況出現的原因在於:其一,對標國內雲產業、SaaS 產業的發展路徑來看,圍繞企業日常經營痛點,能夠幫助企業提高日常經營效率的行業,其滲透率在得以快速提升的同時,其市場規模也會隨之爆發。

圖源:艾瑞諮詢

大模型在提高企業經營效率方面,此前也的確得到了驗證。比如吉宏股份在接入 ChatGPT 接口後,短短几個月的時間內,幫助公司完成 1w+ 新品的上新,並在千萬級商品中新挖掘 150W(10 倍於電商需求)種商品之間的關係,通過 NLP 相關技術提取 15W+ 的電需求概念。並且累計產生新的廣告 7W+,處理圖像素材 2W+,接手客户閒聊與安撫對話 10W+,節省客服 1000 人次工時。

其二,和企業內部自研 OA 系統、會員管理系統不同的是,因大模型訓練期間對企業的算力、人力、資金能力均提出了極高的要求,目前不少企業本身不具備這種能力,這也為大模型企業拓展更多的 TOB 端客户奠定了基礎,這點在谷歌雲、微軟身上已得到驗證。其中,谷歌雲在 4 月到 6 月期間,客户數量增長了 15 倍。微軟 Q2 時,每天新增近 100 名新客户。

其三,和 ToC 端依靠訂閲費用單次幾十元到上百元的費用相比,雖説目前大模型廠商很少對外披露為客户定製大模型的具體費用,但若是考慮大模型企業為客户交付期間所投入的時間、人力以及物力等成本,估計整體費用也不低。

因此從這一角度來看,大模型企業服務 ToB 端也能更好地對沖前期大模型訓練階段所投入的成本,幫助大模型企業儘快找到盈利方式。

混元大模型和其他大模型必有一戰

雖説未來行業大模型的市場空間值得想象,但目前產業大模型距離真正商業化落地仍面臨一些現實挑戰。

一是廠商總把大模型看成萬金油,但行業需要的理解和專注。不少大模型企業覺得只有我有大模型,各行業的客户都要找我合作。

但本質上來看,相較於通用大模型而言,產業大模型實則對廠商的要求了更高的要求。比如如何針對不同行業發展存在的痛點,給出清晰的戰略打法。如何在行業數據匱乏的背景下,訓練出更為精準更符合企業需求的大模型等等。

二是大模型關注的為產品算法創新,但行業實則需要的是需要的是工程化和可操作。

簡單來説就是,下游客户需要的是類似於 SaaS 產品那樣通過標準化的產品,在讓企業內部員工可視化操作的同時,進而幫助企業解決一系列現實問題。

三是 AI 廠商大量宣傳依靠人才能力跑通的個案,但行業需要的是低成本和可複製。

相較於歐美企業而言,我國企業本身在 IT 上並不願意投入太多費用。若產業大模型價格後續無法完成真正下探,這也必然會對下游客户產生勸退。

圖源:wind

下游需求不足之下,這就意味着導致大模型廠商之間的競爭更為白熱化。但失去先發優勢的騰訊混元大模型,在交叉銷售方面可能會不計友商。

一個典型的案例就是在政務市場,華為雲之所以能在政務市場保持較高的市場份額,這是因為脱胎和成長於 ToB 和 ToG 端的華為,內部有專人負責對接 ToG 端需求。哪怕在 ToG 端某個項目上丟失,他們仍會繼續跟進對接,以便後續 ToG 端有其他需求時,能及時跟進。

遇到華為雲必敗也成了阿里雲在拓展 ToG 端客户時,內部心照不宣的説法。因此從這一角度來看,騰訊混元大模型在拓展 ToG 端客户時,可能無法像華為盤古大模型那樣迅速。

圖源:IDC

除上述行業因素外,互聯網時代,騰訊的方法論為 C2B2C。簡單來説就是,將成熟的 APP 推向市場,獲取 ToC 端用户持續增長後,再以用户數據和資源為抓手,反向 ToB。這種方法論雖讓騰訊打造出類似於微信、QQ、王者榮耀等一眾超級 APP,但這種方法論並非萬能的。

其中騰訊在電商時代,起步時間雖早已拼多多、京東等友商,但時至今日騰訊內部仍然缺乏電商基因。對標傳統貨架電商的增長邏輯來看,以貨架電商為模型,以履約平台為形態,完成商家和消費者的連接。再以 TOC 端消費者的龐大的用户數量為基礎,不斷吸引產業鏈上中游商家的入駐,進而以商家規模的提高再次反哺 C 端用户,最終構建出強者恆強的電商模型。

顯然這種模型成立的基礎在於,電商平台發展前期需同時完成 ToC 端和 ToB 端的雙向連接,而非是簡單地僅拓展 ToC 端用户。在大模型時代,更是如此。

一個典型的案例是,不管是 ChatGPT,還是一眾國產大模型,從今年年初至今已完成幾個版本的迭代,這也側面説明市場根本沒有足夠的時間基於一個技術去做市場化的產品,當產品尚未打磨好時,技術就已經在不斷迭代了。

因此對騰訊而言,既要不斷提高騰訊混元大模型的能力,進而和友商構成差異化競爭,也需逐漸探索出真正適合混元大模型的方法論。在 “既要”“又要” 之下,騰訊混元大模型能否完成超過友商步伐,仍需要長期追蹤觀察。