文心一言來了！ChatGPT 的壓力李彥宏接住了嗎

百度文心一言，基於文心大模型技術打造的生成式對話產品，近日正式亮相。百度從 2019 年開始進行大模型探索，打造文心大模型家族，其中 PLATO 主打對話交互。文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。百度宣佈，超過 650 家企業宣佈接入文心一言的生態。在發佈文心一言的同時，百度股價盤中一度大跌 10%。文心一言的英文語種、代碼場景的訓練還不夠多，表現還不夠好。但整體而言，文心一言還遠未到發展完善的階段。

作者｜於惠如編輯｜羅麗娟

“十月懷胎，一朝分娩。”

研發近 5 年，提前一個月宣傳造勢，備受關注的百度文心一言終於揭開神秘面紗。

3 月 16 日，百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼 CEO 李彥宏介紹，文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。

作為國內少有擁有大模型技術的企業，百度從 2019 年開始進行大模型探索，打造文心大模型家族，包含 PLATO、ERNIE 3.0 等多個 NLP 大模型，其中 PLATO 主打對話交互。從技術出發，文心過往在 NLP 模型上的實踐，成為百度打造 “文心一言” 的基礎。

“從這個意義上説，文心一言的發佈只是我們過去多年努力的自然延續。” 李彥宏表示。

為什麼要在此時發佈文心一言？百度真的 ready 了嗎？針對這個高頻問題，李彥宏回答：“因為市場需求。”

“我自己在內測過程中體驗到，（文心一言的）能力確實談不上完美。” 李彥宏坦誠，但是包括搜索、智能雲、自動駕駛和小度在內的百度各個產品線都在等着使用這項技術。尤為重要的是，百度的客户也在等着這項技術的發佈。

在半個小時的介紹裏，李彥宏介紹了文心一言的實用功能。不過因為現場打字不方便，發佈會現場並沒有實時演示文心一言的各項功能，而是使用了提前錄好的 demo 視頻。

在百度發佈文心一言的前一天，OpenAI 發佈了 GPT-4，被冠以 “作為迄今為止規模最大、功能最強大的多模態預訓練模型”。

作為同類型產品，文心一言自然免不了被拿來做對比。李彥宏認為，“ChatGPT 的門檻還是很高的”，而文心一言 “還是有很多不完美的地方”。

“全球大廠中，百度是第一個發佈的，大家都知道微軟是直接調用 OpenAI，其它的大廠現在都沒有真正發佈同類型、同級別的產品。百度是第一個。” 李彥宏説，文心一言這樣的大語言模型，會成為每個人必不可少的生產力工具。

自 2 月份百度官宣 “文心一言” 以來，已有超過 650 家企業宣佈接入文心一言生態。

發佈會尾聲，百度公佈了文心一言的邀請測試方案——3 月 16 日起，首批用户即可通過邀請測試碼，在文心一言官網體驗產品，後續將陸續開放給更多用户。此外，百度智能雲即將面向企業客户開放文心一言 API 接口調用服務。

根據百度提供的數據，發佈會後一小時內，排隊申請文心一言企業版 API 調用服務測試的企業用户已達 3 萬多家，申請產品測試網頁多次被擠爆，百度智能雲官網流量飆升百倍。

但資本市場對此卻有不同的表現。在文心一言發佈的同時，百度股價盤中一度大跌 10%。

不完美"小孩"

發佈會現場，李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解和多模態生成等五個使用場景方面的表現。

文學創作場景中，文心一言根據對話問題將科幻小説《三體》的核心內容進行了總結，並提出了五個續寫《三體》的建議角度；在商業文案創作場景中，文心一言完成了給公司起名、寫 Slogan、寫新聞稿的創作任務；面對 “雞兔同籠” 這類涉及推理等相對複雜的任務，文心一言也給出了正確解題思路及答案。

作為紮根於中國市場的大語言模型，文心一言在中文語言和中國文化上有更好的表現。現場展示中，文心一言正確解釋了成語 “洛陽紙貴” 的含義、“洛陽紙貴” 對應的經濟學理論，還用 “洛陽紙貴” 四個字創作了一首藏頭詩。

不過，李彥宏也承認，文心一言對英文語種、代碼場景的訓練還不夠多，表現還不夠好。“接下來我們還要加緊訓練，不斷完善這些能力。”

在多模態生成能力上，文心一言沒有落後於 GPT-4。

現場，李彥宏展示了文心一言生成文本、圖片、音頻和視頻的能力。文心一言不僅能夠生成四川話等方言語音，還能通過一段文字自動生成視頻。

不過，視頻生成能力因成本較高，現階段還未對所有用户開放，未來會逐步接入。

“多模態是生成式 AI 一個明確的發展趨勢。” 李彥宏稱，未來，隨着百度多模態統一大模型的能力增強，文心一言的多模態生成能力也會不斷提升。

儘管從某種程度上，文心一言具有了對人類意圖的理解能力，回答的準確性、邏輯性、流暢性也還算令人滿意。但整體而言，這類大語言模型還遠未到發展完善的階段。

李彥宏説：“它們有時候會有很驚豔的表現，但不少場景下，細究起來還有明顯的 bug，進步空間很大。”

雖然多次提到產品還不完美，但百度仍將自己定位為：全球大廠中第一個做出對標 ChatGPT 產品的企業。

在李彥宏給出的論據中，百度獨具的四層技術棧優勢佔據重要地位。

人類進入人工智能時代，IT 技術的技術棧發生了根本性變化，從過去三層到 “芯片 - 框架 - 模型 - 應用” 四層。

“而當前，百度是全球為數不多、在這四層進行全棧佈局的人工智能公司。從高端芯片崑崙芯，到飛槳深度學習框架，再到文心預訓練大模型，到搜索、智能雲、自動駕駛、小度等應用，各個層面都有領先業界的自研技術。” 李彥宏表示。

在他看來，百度 AI 全棧佈局的優勢在於，可以在技術棧的四層架構中實現端到端優化，大幅提升效率。尤其是框架層和模型層之間，有很強的協同作用，可以幫助構建更高效的模型，並顯著降低成本。

“無論是哪家公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理，需要多年的堅持和積累，沒法速成。” 李彥宏説。

據全天候科技瞭解，大約在一個多月前，百度對外釋放即將發佈文心一言之時，在其內部已成立了相關 “項目組”。由 CTO 王海峯帶隊，李彥宏深度參與，並從多個業務線進行了人員和資源調配。

該項目組在內部被評價為 “相當神秘”，未到最後一刻，甚至內部員工也無法得知文心一言的具體進展。

但對於今天的發佈，李彥宏依然認為文心一言是一個 “不完美小孩”，“之後，文心一言將建立起真實用户反饋、開發者調用和模型迭代之間的飛輪，效果會迅速提升，給你 ‘士別三日，當刮目相看’ 的驚喜。”

對標 ChatGPT？

趕在百度發佈文心一言的前一天，OpenAI 發佈了 GPT-4，令 AI 達到了 “歷史上前所未有的新高度”。

相較前一代，GPT-4 是一個超大的多模態模型，可接受的文字輸入長度增加到 3.2 萬個 token（大約 2.4 萬單詞）。同時，它可以接受圖像輸入並理解圖像內容。

升級之後，GPT-4 在多項基準考試中表現出的水平和人類相當甚至更高。比如：在美國律師資格考試 Uniform Bar Exam、法學院入學考試 LSAT、“美國高考” SAT 數學部分和證據性閲讀與寫作部分的考試中，它的得分高於 88% 的應試者。

不過，GPT-4 也提高了使用門檻，目前還沒有免費版本，其訪問權限僅面向 ChatGPT Plus 的付費訂閲用户及企業和開發者開放。而且，目前 GPT-4 每 4 小時只能回答 100 個問題。

不過，隨着 GPT-4 能力的增強和更穩定不易出錯的性能，也為此後落地商業化提供了更多的可能性。

在眾多國內佈局生成式對話產品的公司中，百度被認為是最有希望與 OpenAI 媲美的一家。文心一言是否夠得上與 ChatGPT 一戰？

李彥宏在發佈會上的表現稱得上謙遜：ChatGPT 的門檻還是很高的。文心一言仍算不上完美。

根據發佈會傳遞的信息，從功能角度出發，二者均具備文學創作、數理推算、語義理解、多模態生成等能力。不過，GPT-4 之前宣傳的圖片輸入生成文本仍未向公眾開放，生成圖片及視頻能力也僅僅停留在展示頁面。而文心一言可生成圖片及視頻內容。

一位 AIGC 領域創業者對全天候科技説：“文心一言不需要碾壓 ChatGPT，如果滿分是 100 分，百度的文心一言只要能做到超過及格線，就很不錯了。”

在這位創業者看來，AIGC 太重要了，無論國內做得如何，都得先推出一個產品。“就像搜索引擎，國外有 Google，國內就得有百度。”

李彥宏預測，大語言模型將帶來三大產業機會：第一類是新型雲計算公司，其主流商業模式從 IaaS 變為 MaaS；第二類是進行行業模型精調的公司；第三類是基於大模型底座進行應用開發的公司，即應用服務提供商。

即便如此，百度仍然未提及關於文心一言可行的、清晰的商業模式及變現方式。然而從可能落地的商業化場景看，OpenAI 已經有明確的商業化模式和變現路徑。

“我們當然希望文心一言能更好，因為任何東西得有競爭，價格才能打下來。我們公司現在調用的是 OpenAI 的接口，調用頻率還蠻高的。現在我要給 OpenAI 這筆錢，是因為我沒得選。” 前述 AIGC 領域創業者表示。