AI Big Models Engage in Fierce Battle! Within a Day, Giants like Huawei, Alibaba, TENCENT, etc. All Take Action

一天之內，多家巨頭宣佈 AI 新進展，大模型混戰卷出新高度。

最近幾個月，國產大模型的內卷激烈程度可以用 “神仙打架” 來形容。本週五，大模型混戰又達到了新高度，據華爾街見聞不完全統計，僅在今天，就有華為、阿里、騰訊、商湯、京東等企業發佈或更新大模型。

“百模大戰” 的盛況中，誰最有可能造出中國版 GPT-4？

華為雲盤古大模型 3.0 正式發佈

7 月 7 日，華為雲在開發者大會 2023 上發佈盤古大模型 3.0。華為常務董事、華為雲 CEO 張平安表示，盤古大模型 3.0 是完全面向行業的大模型，包括 “5+N+X” 三層架構。

張平安在會上表示，盤古大模型不會作詩，只做事，將圍繞 “行業重塑”“技術紮根”“開放同飛” 三大創新方向，持續打造核心競爭力，為行業客户、夥伴及開發者提供更好的服務。

三層架構分別為：

L0 層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型，提供滿足行業場景中的多種技能需求。盤古 3.0 為客户提供 100 億參數、380 億參數、710 參數和 1000 億參數的系列化基礎大模型，匹配客户不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集，包括 NLP 大模型的知識問答、文案生成、代碼生成，以及多模態大模型的圖像生成、圖像理解等能力，這些技能都可以供客户和夥伴企業直接調用。無論多大參數規模的大模型，盤古提供一致的能力集。

L1 層是 N 個行業大模型，華為雲既可以提供使用行業公開數據訓練的行業通用大模型，包括政務，金融，製造，礦山，氣象等大模型；也可以基於行業客户的自有數據，在盤古大模型的 L0 和 L1 層上，為客户訓練自己的專有大模型。

L2 層為客户提供了更多細化場景的模型，更加專注於政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、颱風路徑預測等具體行業應用或特定業務場景，為客户提供 “開箱即用” 的模型服務。

盤古大模型採用完全的分層解耦設計，可以快速適配、快速滿足行業的多變需求。客户既可以為自己的大模型加載獨立的數據集，也可以單獨升級基礎模型，也可以單獨升級能力集。

在 L0 和 L1 大模型的基礎上，華為雲還為客户提供了大模型行業開發套件，通過對客户自有數據的二次訓練，客户就可以擁有自己的專屬行業大模型。同時，根據客户不同的數據安全與合規訴求，盤古大模型還提供了公用雲、大模型雲專區、混合雲多樣化的部署形態。

阿里 AIGC 應用 “通義萬相”

在 2023 年世界人工智能大會上，阿里雲正式推出 AI 繪畫新品 “通義萬相”。

基於阿里研發的組合式生成模型 Composer，通義萬相提出了基於擴散模型的「組合式生成」框架，通過對配色、佈局、風格等圖像設計元素進行拆解和組合，提供了高度可控性和極大自由度的圖像生成效果。

用户可以在通義萬相中輸入提示詞，以輸出相應圖像。除文生圖以外，通義萬相也推出了包括風格遷移、相似圖生成等功能。

從此，圖片設計的門檻將大幅降低，無論是藝術設計、遊戲，還是文創，都將迎來一場變革。

目前，通義萬相具有以下三大功能：文生圖、相似圖生成、風格遷移。

文生圖功能為基本的形式，只要輸入 prompt，選定創作風格（水彩、油畫、中國畫、扁平插畫、二次元、素描、3D 卡通等），通義萬相就可以自動生成海量的創意靈感。通義萬相已正式上線，對外提供服務。

相似圖生成則可以讓用户根據現有素材，快速地批量擴展相似素材。只要用户提供一張參考圖像，就可以獲得一張與之內容、風格類似的圖像。

而風格遷移，則是為一張原圖生成一幅指定風格的新圖。

下圖為來自 “新智元” 的測試，使用通義萬相將下圖穿着白紗女性，改成法國印象派畫家雷諾阿的風格。

遷移完成後，得到了這樣一幅印象派的人物肖像。

據 “新智元” 測評表示，通義萬相的部分作圖能力，已經在逼近全球最牛 AI 作畫神器 Midjourney。

騰訊 MaaS 平台升級

世界人工智能大會期間，騰訊雲宣佈升級 MaaS 平台，將行業大模型能力應用到金融風控、同傳翻譯、數智人客服等新場景中；其中，首次公佈的金融風控大模型，相比傳統風控有 10 倍效率提升。

在技術底座領域，自研星脈高性能計算網絡、向量數據庫，為大模型的行業應用提供更充沛的算力基礎設施。其中，最新升級的騰訊雲自研星脈高性能計算網絡，能提升 40% 的 GPU 利用率，節省 30%~60% 的模型訓練成本，為 AI 大模型帶來 10 倍通信性能提升。基於騰訊雲新一代算力集羣 HCC，可支持 10 萬卡的超大計算規模。騰訊雲 AI 原生向量數據庫，最高支持 10 億級向量檢索規模，延遲控制在毫秒級，相比傳統單機插件式數據庫檢索規模提升 10 倍，同時具備百萬級每秒查詢（QPS）的峯值能力。

在應用創新方面，騰訊雲行業大模型能力應用到金融風控、交互翻譯、數智人客服等場景中，極大提升了智能應用效率。

行業大模型加持的金融風控解決方案，相比之前有了 10 倍效率提升，通過騰訊積累超過 20 年的黑灰產對抗經驗和上千個真實業務場景，整體反欺詐效果比傳統模式有 20% 左右的提升。企業可以基於 prompt 模式，迭代風控能力，從樣本收集、模型訓練到部署上線，實現全流程零人工參與，建模時間也從 2 周減少到僅需 2 天。即便樣本積累有限的情況下，也可以完成快速搭建，跳過 “冷啓動” 過程。

在交互翻譯領域，基於行業大模型技術加持，同傳技術不再需要百萬級的訓練數據，僅需 “小樣本” 訓練就能實現較好效果，專業領域的翻譯也能減少人工調優的參與，保障翻譯效果，在多個垂直行業落地。其中，騰訊同傳已經連續六年為世界人工智能大會主論壇提供 AI 同傳服務。

在數智人領域，今年騰訊雲推出了小樣本數字人工廠，僅需少量數據、24 小時內即可復刻 2D 數字分身，讓企業應用數智人服務成本大大降低。現在，依託 AI 生成算法，數智人 3D 形象的復刻速度得到大幅提升，通過生成式動作驅動，結合行業大模型能力，可讓企業獲得更 “個性化、專業、自然逼真” 的數智員工，讓 “面對面” 專業服務成為可能。

商湯大模型全面升級

世界人工智能大會期間，在 “大愛無疆·日日新” 人工智能論壇上，商湯科技宣佈 “商湯日日新 SenseNova” 大模型體系將多方位全面升級，以及在該體系下的一系列大模型產品更新和落地成果。

作為千億級參數的自然語言處理模型，商湯商量 SenseChat 2.0 版本突破了大語言模型輸入長度限制，並推出不同參數量級的模型版本，可完美適配移動端、雲端等不同終端及場景的應用需求，降低部署成本。商湯的自研生成式大模型商湯秒畫 SenseMirage 3.0 的模型參數從今年 4 月首次發佈以來的 10 億提升至 70 億量級，能夠實現專業攝影級的圖片細節刻畫。

不僅如此，商湯如影 SenseAvatar 2.0 數字人生成平台相較 1.0 版本的語音和口型流暢度提升 30% 以上，實現 4K 高清視頻效果，並帶來 AIGC 生成形象及數字人歌唱功能。此外，商湯瓊宇 SenseSpace 2.0 的空間重建效率提升 20%，渲染性能提升 50%，每 100 平方公里場景的建圖時間僅需 38 小時即可完成（1200 TFLOPS/秒算力支持）；而商湯格物 SenseThings 2.0 對小物體的紋理及材質還原達到毫米級精細度，並突破對高反光和鏡面物體的採集難題。

在金融領域，商湯與銀行、保險、券商等客户展開合作，利用數字人進行智能客服、智慧營銷等工作，並通過接入大語言模型能力，提供投研分析、研報撰寫等新功能，實現降本增效。此外，掛載金融知識庫後，還能 100% 基於客户的產品説明進行內容問答輸出，並實現信息及時更新。

在醫療場景，商湯基於海量醫學知識和臨牀數據打造了中文醫療語言大模型 “大醫”，提供導診、問診、健康諮詢、輔助決策等多場景多輪會話能力，未來也即將支持醫學圖像、文本、結構化數據等多模態綜合分析，並可不斷提升醫療語言理解和推理能力，持續賦能醫院診療效率及患者服務提升。

其他 AI 企業進展

本土 AI 獨角獸出門問問發佈 “序列猴子”

出門問問攜內測探索大模型 “序列猴子” 及 AI CoPilot 解決方案亮相世界人工智能大會。據介紹，“序列猴子” 是一款具備多模態生成能力的大語言模型，模型以語言為核心的能力體系涵蓋 “知識、對話、數學、邏輯、推理、規劃” 六個維度，能夠同時支持文字生成、圖片生成、3D 內容生成、語言生成和語音識別等不同任務。“序列猴子” 具備自然語言理解、知識、邏輯以及推理等能力，並可以基於這些能力進行對話。

京東：正在訓練大模型，對其前景很有信心

京東集團副總裁、探索研究院院長何曉冬表示，目前訓練時間在兩個月左右的基礎通用大模型，成本估計在幾千萬元，對大模型的商業前景和落地場景很有信心。他建議，創業公司入局大模型應該找到屬於自己的 “護城河”，面對目前的 “百模大戰” 現狀，何曉冬認為，對於市場而言，有壓力和競爭是好事，將有效促進行業發展。