Baidu AI, making money through Killer Apps

華爾街見聞
2024.05.20 02:03
portai
I'm PortAI, I can summarize articles.

24Q1 財報會議上,百度集團透露了公司 AI 業務的最新進展。

本文作者:張逸凡

編輯:申思琦

來源:硬 AI

百度,一家在 PC 時代嶄露頭角的科技巨頭,面臨了在移動互聯網時代的挑戰和競爭,似乎未能完全抓住時代的機遇,相比於其他科技公司在這一階段的快速發展,百度顯得有些落後。

隨着時間進入人工智能(AI)時代,百度希望能夠藉此機會彌補過去在移動互聯網時代的失地,重新確立自己在技術領域的領導地位。

在剛剛結束的百度最新財報會上,公司透露了 AI 業務的最新進展:

• AI 雲服務營收同比增長 12%;

• 百度搜索 11% 內容由 AI 生成;

• 大模型 API 調用量激增:近五個月,從 5000 萬增長至 2 億;

• AI 模型性能大幅優化:訓練效率提高到 5.1 倍,推理成本降低到百分之一;

百度董事長兼首席執行官李彥宏在電話會中表示,公司正在從以互聯網為中心轉向人工智能優先,推進用文心大模型重構 To C 和 To B 業務。目前,文心大模型日均處理 Tokens 文本約 2500 億,日均調用量 2 億次。

李彥宏特別強調:搜索最有可能成為 AI 時代的 “殺手級” 應用(killer app),而百度搜索的 AI 重構工作仍處於早期階段。

此外,百度 CFO 羅戎稱,在未來幾個季度,百度將繼續支持 AI 業務高質量增長。公司認為,隨着中國生成式 AI 的新時代展開,將為百度帶來更多機遇。

一、“All in AI” —— 百度的新機遇?

為了實現李彥宏 “以互聯網為中心轉向人工智能優先” 這一目標,百度正大力投資於 AI 技術的研發和應用,特別是在自動駕駛、深度學習、自然語言處理等領域。

百度正試圖搶回在移動互聯網時代失去的陣地。

• PC 時代,憑藉着獨特的搜索引擎技術,百度成為了國內的搜索龍頭;

• 移動互聯網時代,用户流量從 PC 端轉移到移動端,公司雖多方位佈局,但相較於騰訊/阿里仍顯遜色;

• 在推薦算法時代,又大幅落後於字節信息去中心化模式;

• 邁入 AI 時代,百度基於其在 AI 領域擁有的深厚積累,希望能夠在此浪潮中突圍;

AI 效果在財報中已逐漸突出,今年一季度智能雲業務的收入達到 47 億元,同比增長 12%,來自生成式人工智能和基礎模型的收入佔智能雲業務收入的 6.9%。

二、AI 雲服務,從芯片到平台

2016 年,百度 CEO 李彥宏提出 “AI+ 雲 + 大數據” 的雲服務戰略。

此後,百度智能雲構建了 “芯片—框架—模型—MaaS 平台” 的全棧式 AI 基礎設施,這一基礎設施支持從數據存儲到模型訓練、部署、運行的全鏈路 AI 服務。

值得一提的是,百度飛槳平台已經兼容了 50 多種不同芯片,許多是本土設計的,開發者社區已經增長至 1300 萬。

這種 AI 基礎設施佈局模式,也讓百度在受制外部環境情況下,更好的匹配國內 AI 雲需求。李彥宏認為,這種模式使得百度能夠將不太先進的芯片用於高度有效的模型訓練和推理。

李彥宏在電話會中稱,百度把來自不同供應商的 GPU 集成到統一的計算集羣中,以訓練大語言模型,“我們的平台在 GPU 集羣上展示了非常高的效率,該集羣由成百上千的 GPU 組成,這是在進口 GPU 受到限制的背景下取得的重要突破。”

1)自主研發芯片

公司自主研發了 AI 芯片(崑崙)和語音交互芯片(鴻鵠),用於優化語音、自然語言處理、圖像等 AI 技術,並支持公司的深度學習框架。

芯片最新進展:

• AI 芯片:迭代到崑崙 2,相比崑崙 1 代性能提升了 2-3 倍,提供 128TFLOPS 算力,內存帶寬 512GB/s;

• 語音交互芯片:迭代到鴻鵠 900,較上一代鴻鵠 818 芯片,CPU 性能提升 200%,GPU 提升 160%,搭載於華為智慧屏 V5 Pro;

2)深度學習框架 —— Paddle Paddle

Paddle Paddle 是百度基於 BERT 自研的深度學習框架,集成了深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件。

該框架服務企業遍佈能源、金融、工業、醫療、農業等多個行業。例如,連心醫療基於 PaddlePaddle 平台開發的 “基於 CT 影像的肺炎篩查與病情預評估 AI 系統” 已在湖南郴州湘南學院附屬醫院投入使用。

Paddle Paddle 採用了開源的形式,方便百度更好的建立自己的 AI 生態圈。

根據公司披露的信息:

• 截至 2024 年 4 月中旬,PaddlePaddle 開發者社區已經擁有了 1300 萬名成員;

• 截至 2023 年底, PaddlePaddle 為 23.5 萬家企業提供服務,開發社區已經創建了 86 萬個模型;

此外,數據顯示,Paddle Paddle 在 Github 使用人數、貢獻者人數和技術迭代速度上,僅次於海外一線平台 Pytorch 和 TensorFlow。

3)AI 大模型 —— 文心繫列模型(Ernie)

基於強大的基礎模型(Paddle Paddle),百度研發了文心繫列模型 Ernie(有趣小故事:文心一言的英文名為 “Ernie”, 源於美國兒童節目《芝麻街》中的角色的名字,而節目中 Ernie 的好朋友正是 Bert,Bert 是谷歌 2018 年發佈的 AI 模型)。

目前迭代至文心 4.0,參數規模可能超 1 萬億,約為文心 3.5 的 4-5 倍。

根據公司披露,截至今年 4 月,文心模型每天處理的 API 調用約為 2 億次,遠超去年 12 月的約 5000 萬次調用,表明百度文心模型正被越來越多的人所採用,並預示着未來模型推理具備強勁的收入潛力。

此外,為了讓模型更具性價比,公司通過獨有的四層人工智能架構和強大的端到端優化能力,不斷提高模型的效率。與 3 月 23 日的版本相比,文心模型的訓練效率提高到 5.1 倍,推理成本降低到百分之一。

4)MaaS(AI 開發雲平台)

為了讓開發者更簡單的開發 AI 模型,百度在雲平台上提供了三套工具:

• AppBuilder 和 ModelBuilder:供企業和個人開發者開發應用程序和搭建模型;

• AgentBuilder:可以輕鬆創建一個 AI Agent;

盈利方面,百度從 2022 開始將業務重點放在提升 AI 智能雲業務的利潤率上,廢除了低質量業務,同時致力於為不同行業的客户定製標準化 AI 解決方案。

24Q1 的業績會上,公司表示,智能雲收入增長主要由生成式 AI 和模型訓練驅動。目前,大部分收入來自模型訓練,但來自模型推理的收入增長很快。

展望未來,百度認為模型推理是最重要的長期機遇之一,也是未來人工智能雲收入的主要增長動力。

三、“AI+” 業務賦能

AI 技術在百度內部廣泛應用於搜索引擎、信息流推薦、百度翻譯等多個領域。在電話會中,李彥宏對未來 AI 賦能搜索支柱業務信心更足,認為搜索是 AI 時代最可能成為殺手級應用的產品:“AI 搜索能使用户能夠做到以前做不到的事,並且百度暫時還沒打算對這部分收費。”

去年第二季度開始,百度就已經使用文心一言重建百度搜索,現在越來越多的搜索結果是文心一言以不同格式如文本、圖像、第三方鏈接等組合而成的。

在模型構建上,百度使用了 3 種輕質模型和 2 種針對特定任務的模型,並且搭配專家混合模型,用來給大模型分配任務,在性能和成本上找到了更好的平衡。

從數據上看,AI 確實正在提升百度各個業務的效率:

1)AI+ 百度搜索:截至 24Q1,百度搜索有 11% 的內容由 AI 生成,同時,AI 搜索推動了廣告收入的增長;

2)AI+ 百度文庫:通過引入生成式 AI 功能,吸引了 18% 的新付費用户。這些功能包括內容總結、創作、擴展以及將靈感一鍵轉化為 Powerpoint 等。24Q1 百度文庫付費用户數量實現了兩位數的同比增長。

3)AI+ 百度地圖:引入了 “AI 嚮導” 功能,在理解用户需求的基礎上,智能調用眾多地圖功能及服務,快捷準確地給出解決方案;

4)AI+ 百度網盤:推出了基於文心大模型的智能助理 “雲一朵”,幫助用户實現一句話快速搜索文件和視頻、總結知識、翻譯文檔、甚至進行內容創作的功能。 截至 23Q3“雲一朵” 的用户已達到 2000 萬。

四、終端廠商合作 AI 手機/AI PC

AI 除了對內提升效率,本季度百度也進一步擴大了對外合作。

根據公司披露,上季度,公司已與三星中國、榮耀等手機廠商達成合作。本季度,合作擴展到更多領先智能手機廠商,包括 Oppo、VIVO 和小米。

業務範圍也從智能手機擴展到 PC 和電動汽車領域,進一步擴大了百度的 AI 生態圈。聯想正利用 Ernie API 為其默認瀏覽器中的 AI 助手提供支持,蔚來汽車開始使用 Ernie API 增強車內體驗。

此外,公司吸引了許多新客户,包括攜程、高途、招聘、作業幫和新加坡旅遊局,通過 AI 技術,幫助他們重構所有面向消費者的產品,以提供更好的用户體驗。

五、對外投資

除了自主研發,百度也通過對外投資來不斷擴展自家的 AI 生態,覆蓋了芯片 - 模型 - 模型應用三大環節。但很明顯,與阿里不同,百度的對外投資更偏向於上下兩端。

這個原因也不難理解,因為百度未來將依靠搜索這類應用端支撐收入,完成商業模式閉環的。

最有代表性的一個證明來自李彥宏對大模型開源還是閉源的判斷:“大模型開源意義不大,閉源才能走通商業模式,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。”

“閉源在成本上反而是有優勢的,只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定更快”,這也是與阿里雲不同的商業模式的思考。

所以,按照百度的思路,未來的路已經比較清晰,但 AI 時代的競爭顯然會比 PC 時代更加激烈。