Track Hyper | Soul launches a full-duplex communication large model

華爾街見聞
2025.08.01 08:15
portai
I'm PortAI, I can summarize articles.

在 2025 世界人工智能大會上,社交平台 Soul App 展示了其自研的全雙工通話大模型,計劃在 Soul 平台內測。該模型旨在提升虛擬人實時通話和 AI 匹配的互動體驗,打破傳統的輪次對話模式,允許 AI 主動參與對話,提升人機交互的自然度。通過多維度感知體系,AI 能夠更好地理解用户意圖和情感狀態,推動更流暢的交流。

作者:周源/華爾街見聞

在 2025 世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)展覽現場,社交平台 Soul App 展示了其自研的全雙工通話大模型。

該模型即將在 Soul 平台開啓內測,後續計劃應用於虛擬人實時通話、AI 匹配等 1V1 及多對多互動場景,是社交領域的一項新探索。

就眼下 Soul 的 “虛擬人” 應對用户互動場景的表現來看,已深具 “真實感”,但這種互動目前僅限於文字形式。

此次推出自研全雙工通話大模型,若能實現實時通話,則其智能性確然會有更大提升。

調整傳統交互模式​

傳統語音交互長期依賴 VAD(話音活性檢測)機制與延遲控制邏輯,形成輪次對話模式。

這種模式的人機對話,呈現一問一答刻板節奏:用户發言結束後,AI 才開始響應,中間存在明顯延遲,影響了交互的自然性。

在很多時候,用户發言過程中會出現短暫停頓,這可能被系統誤判為發言結束,導致 AI 過早介入,打斷用户思路,交流顯得過於生硬。

Soul 自研的端到端全雙工語音通話大模型,對這一傳統模式做了調整:不再採用 VAD 機制,嘗試通過算法讓 AI 自主把控對話節奏。

在實際交互中,AI 可實時監測對話動態,有能力做出主動打破沉默、適時打斷用户、邊聽邊説等操作。

比如,用户講述事情時稍作停頓思考,AI 能察覺並非發言結束,補充引導性話語推動話題;在多人交流場景中,AI 能判斷髮言時機加入討論,與用户發言相互交織,使對話更流暢,接近人與人面對面交流的狀態。

在理論上,這種交互模式使 AI 從被動的回應者轉變為主動的參與者,在一定程度上能提升人機對話的自然度。

為讓 AI 在交互中更接近 “真人”,Soul 的全雙工通話大模型構建了多維度感知體系,包括時間感知、環境感知、事件感知等。通過分析這些維度的信息,AI 試圖更好地理解用户意圖和情感狀態,給出貼合情境的回應。

從時間感知來看,AI 會依據對話時間調整語言風格和話題。清晨可能以 “早上好,新的一天有什麼安排嗎?” 開啓對話;深夜用户傾訴煩惱時,回應會更温柔,給予情感支持。

在環境感知上,模型能識別用户所處環境,嘈雜時適當提高音量保證清晰,安靜時聲音則更輕柔。

在事件感知方面,AI 能結合討論的事件給出針對性觀點。用户分享工作中完成重要項目時,AI 會表示祝賀並詢問細節,增加對話的真實感。​

此外,模型在口語化表達和音色復刻上做了優化:能模擬語氣詞、結巴、情緒起伏等日常口語特徵,還可根據用户需求復刻特定音色。

還有情緒表達,AI 的聲音情緒會隨對話推進變化,用户分享喜悦時語調上揚,用户情緒低落時聲音低沉關切。

這些處理在一定程度上提升了 AI 交互的真實感,但距離完全模擬真人還有差距,仍有較大的提升空間。

事實上,在該大模型推出前,Soul 虛擬人在 1V1 或在響應用户評論時的互動中,其表現也有較高的自然性和智能性。若 Soul 沒有標註 “虛擬人” 標籤,其應對內容已具有高度的 “真人” 感。

AI 推升電子社交真實性​

全雙工通話大模型在 Soul 平台的多個應用場景中得以應用,在 1V1 和多對多互動場景中,會對用户的社交體驗產生影響。

​在虛擬人實時通話場景中,該模型有望讓虛擬人與用户的交流更自然。

以往虛擬人對話較刻板,有了這一模型後,虛擬人可實時捕捉用户情緒和話語變化,調整回應方式和語氣,提供更個性化的陪伴服務,使用户感受到更真實的情感反饋。

在 AI 匹配的 1V1 互動場景中,模型發揮了怎樣的作用?比如能通過算法幫助用户篩選契合的聊天對象,提高社交匹配效率。

在交流過程中,模型分析雙方對話內容和情緒,適時提供話題建議或引導:當匹配雙方初次交流出現冷場,AI 會拋出與雙方興趣相關的話題,如 “聽説你們都喜歡攝影,最近有拍到滿意的作品嗎?” 打破僵局,讓交流更順暢。

在多人語音互動場景如羣聊派對中,AI 主持人具備相應功能:用户進入羣聊派對後,AI 主持人能管理羣聊秩序,控制發言順序、提醒文明交流,還能與用户語音互動。

當羣內氣氛沉悶時,發起如 “大家最近有看什麼好電影,分享一下吧?” 的話題,吸引用户參與;新成員加入時,熱情打招呼並引導相互認識,幫助新成員融入,在一定程度上可能提升羣聊派對的參與度。

​Soul 全雙工通話大模型的出現,為自身平台發展帶來了新的方向,也為 AI 社交行業提供了參考案例。

這個模型展示了 AI 技術在社交領域的一種應用可能:即通過技術創新突破傳統交互限制,實現更自然的社交體驗。

隨着該技術的推廣應用,其他社交平台可能會增加 AI 技術研發投入,探索將 AI 技術融入社交場景,推動行業技術發展。比如提升對話流暢性,或在多維度感知方面深入研究,增強社交體驗的沉浸感。​

Soul 的實踐會吸引更多開發者關注 AI 社交領域,促使新的社交應用和服務出現。AI 社交的發展會影響人們的社交方式和觀念,打破地域、時間限制,讓人們更便捷地結識不同地區的朋友,拓展社交圈。

隨着 AI 在社交中作用漸顯,人們對 “社交” 的定義可能發生變化,更注重與 AI 及其他用户的情感共鳴和信息交流。

Soul 全雙工通話大模型即將內測並應用,是 AI 社交領域的一次新嘗試:憑藉新的技術架構和應用場景,為用户帶來新的社交體驗,為行業發展提供思路。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。