
文心一言來了!ChatGPT 的壓力李彥宏接住了嗎

百度文心一言,基於文心大模型技術打造的生成式對話產品,近日正式亮相。百度從 2019 年開始進行大模型探索,打造文心大模型家族,其中 PLATO 主打對話交互。文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。百度宣佈,超過 650 家企業宣佈接入文心一言的生態。在發佈文心一言的同時,百度股價盤中一度大跌 10%。文心一言的英文語種、代碼場景的訓練還不夠多,表現還不夠好。但整體而言,文心一言還遠未到發展完善的階段。
作者|於惠如 編輯|羅麗娟
“十月懷胎,一朝分娩。”
研發近 5 年,提前一個月宣傳造勢,備受關注的百度文心一言終於揭開神秘面紗。
3 月 16 日,百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼 CEO 李彥宏介紹,文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。

作為國內少有擁有大模型技術的企業,百度從 2019 年開始進行大模型探索,打造文心大模型家族,包含 PLATO、ERNIE 3.0 等多個 NLP 大模型,其中 PLATO 主打對話交互。從技術出發,文心過往在 NLP 模型上的實踐,成為百度打造 “文心一言” 的基礎。
“從這個意義上説,文心一言的發佈只是我們過去多年努力的自然延續。” 李彥宏表示。
為什麼要在此時發佈文心一言?百度真的 ready 了嗎?針對這個高頻問題,李彥宏回答:“因為市場需求。”
“我自己在內測過程中體驗到,(文心一言的)能力確實談不上完美。” 李彥宏坦誠,但是包括搜索、智能雲、自動駕駛和小度在內的百度各個產品線都在等着使用這項技術。尤為重要的是,百度的客户也在等着這項技術的發佈。
在半個小時的介紹裏,李彥宏介紹了文心一言的實用功能。不過因為現場打字不方便,發佈會現場並沒有實時演示文心一言的各項功能,而是使用了提前錄好的 demo 視頻。

在百度發佈文心一言的前一天,OpenAI 發佈了 GPT-4,被冠以 “作為迄今為止規模最大、功能最強大的多模態預訓練模型”。
作為同類型產品,文心一言自然免不了被拿來做對比。李彥宏認為,“ChatGPT 的門檻還是很高的”,而文心一言 “還是有很多不完美的地方”。
“全球大廠中,百度是第一個發佈的,大家都知道微軟是直接調用 OpenAI,其它的大廠現在都沒有真正發佈同類型、同級別的產品。百度是第一個。” 李彥宏説,文心一言這樣的大語言模型,會成為每個人必不可少的生產力工具。
自 2 月份百度官宣 “文心一言” 以來,已有超過 650 家企業宣佈接入文心一言生態。

發佈會尾聲,百度公佈了文心一言的邀請測試方案——3 月 16 日起,首批用户即可通過邀請測試碼,在文心一言官網體驗產品,後續將陸續開放給更多用户。此外,百度智能雲即將面向企業客户開放文心一言 API 接口調用服務。
根據百度提供的數據,發佈會後一小時內,排隊申請文心一言企業版 API 調用服務測試的企業用户已達 3 萬多家,申請產品測試網頁多次被擠爆,百度智能雲官網流量飆升百倍。
但資本市場對此卻有不同的表現。在文心一言發佈的同時,百度股價盤中一度大跌 10%。
不完美"小孩"
發佈會現場,李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解和多模態生成等五個使用場景方面的表現。
文學創作場景中,文心一言根據對話問題將科幻小説《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度;在商業文案創作場景中,文心一言完成了給公司起名、寫 Slogan、寫新聞稿的創作任務;面對 “雞兔同籠” 這類涉及推理等相對複雜的任務,文心一言也給出了正確解題思路及答案。
作為紮根於中國市場的大語言模型,文心一言在中文語言和中國文化上有更好的表現。現場展示中,文心一言正確解釋了成語 “洛陽紙貴” 的含義、“洛陽紙貴” 對應的經濟學理論,還用 “洛陽紙貴” 四個字創作了一首藏頭詩。
不過,李彥宏也承認,文心一言對英文語種、代碼場景的訓練還不夠多,表現還不夠好。“接下來我們還要加緊訓練,不斷完善這些能力。”
在多模態生成能力上,文心一言沒有落後於 GPT-4。
現場,李彥宏展示了文心一言生成文本、圖片、音頻和視頻的能力。文心一言不僅能夠生成四川話等方言語音,還能通過一段文字自動生成視頻。

不過,視頻生成能力因成本較高,現階段還未對所有用户開放,未來會逐步接入。
“多模態是生成式 AI 一個明確的發展趨勢。” 李彥宏稱,未來,隨着百度多模態統一大模型的能力增強,文心一言的多模態生成能力也會不斷提升。
儘管從某種程度上,文心一言具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性也還算令人滿意。但整體而言,這類大語言模型還遠未到發展完善的階段。
李彥宏説:“它們有時候會有很驚豔的表現,但不少場景下,細究起來還有明顯的 bug,進步空間很大。”
雖然多次提到產品還不完美,但百度仍將自己定位為:全球大廠中第一個做出對標 ChatGPT 產品的企業。
在李彥宏給出的論據中,百度獨具的四層技術棧優勢佔據重要地位。
人類進入人工智能時代,IT 技術的技術棧發生了根本性變化,從過去三層到 “芯片 - 框架 - 模型 - 應用” 四層。
“而當前,百度是全球為數不多、在這四層進行全棧佈局的人工智能公司。從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能雲、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。” 李彥宏表示。

在他看來,百度 AI 全棧佈局的優勢在於,可以在技術棧的四層架構中實現端到端優化,大幅提升效率。尤其是框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,並顯著降低成本。
“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。” 李彥宏説。
據全天候科技瞭解,大約在一個多月前,百度對外釋放即將發佈文心一言之時,在其內部已成立了相關 “項目組”。由 CTO 王海峯帶隊,李彥宏深度參與,並從多個業務線進行了人員和資源調配。
該項目組在內部被評價為 “相當神秘”,未到最後一刻,甚至內部員工也無法得知文心一言的具體進展。
但對於今天的發佈,李彥宏依然認為文心一言是一個 “不完美小孩”,“之後,文心一言將建立起真實用户反饋、開發者調用和模型迭代之間的飛輪,效果會迅速提升,給你 ‘士別三日,當刮目相看’ 的驚喜。”
對標 ChatGPT?
趕在百度發佈文心一言的前一天,OpenAI 發佈了 GPT-4,令 AI 達到了 “歷史上前所未有的新高度”。
相較前一代,GPT-4 是一個超大的多模態模型,可接受的文字輸入長度增加到 3.2 萬個 token(大約 2.4 萬單詞)。同時,它可以接受圖像輸入並理解圖像內容。
升級之後,GPT-4 在多項基準考試中表現出的水平和人類相當甚至更高。比如:在美國律師資格考試 Uniform Bar Exam、法學院入學考試 LSAT、“美國高考” SAT 數學部分和證據性閲讀與寫作部分的考試中,它的得分高於 88% 的應試者。
不過,GPT-4 也提高了使用門檻,目前還沒有免費版本,其訪問權限僅面向 ChatGPT Plus 的付費訂閲用户及企業和開發者開放。而且,目前 GPT-4 每 4 小時只能回答 100 個問題。
不過,隨着 GPT-4 能力的增強和更穩定不易出錯的性能,也為此後落地商業化提供了更多的可能性。
在眾多國內佈局生成式對話產品的公司中,百度被認為是最有希望與 OpenAI 媲美的一家。文心一言是否夠得上與 ChatGPT 一戰?
李彥宏在發佈會上的表現稱得上謙遜:ChatGPT 的門檻還是很高的。文心一言仍算不上完美。

根據發佈會傳遞的信息,從功能角度出發,二者均具備文學創作、數理推算、語義理解、多模態生成等能力。不過,GPT-4 之前宣傳的圖片輸入生成文本仍未向公眾開放,生成圖片及視頻能力也僅僅停留在展示頁面。而文心一言可生成圖片及視頻內容。
一位 AIGC 領域創業者對全天候科技説:“文心一言不需要碾壓 ChatGPT,如果滿分是 100 分,百度的文心一言只要能做到超過及格線,就很不錯了。”
在這位創業者看來,AIGC 太重要了,無論國內做得如何,都得先推出一個產品。“就像搜索引擎,國外有 Google,國內就得有百度。”
李彥宏預測,大語言模型將帶來三大產業機會:第一類是新型雲計算公司,其主流商業模式從 IaaS 變為 MaaS;第二類是進行行業模型精調的公司;第三類是基於大模型底座進行應用開發的公司,即應用服務提供商。
即便如此,百度仍然未提及關於文心一言可行的、清晰的商業模式及變現方式。然而從可能落地的商業化場景看,OpenAI 已經有明確的商業化模式和變現路徑。
“我們當然希望文心一言能更好,因為任何東西得有競爭,價格才能打下來。我們公司現在調用的是 OpenAI 的接口,調用頻率還蠻高的。現在我要給 OpenAI 這筆錢,是因為我沒得選。” 前述 AIGC 領域創業者表示。
