Track Hyper | Soul launches a full-duplex communication large model

在 2025 世界人工智能大会上，社交平台 Soul App 展示了其自研的全双工通话大模型，计划在 Soul 平台内测。该模型旨在提升虚拟人实时通话和 AI 匹配的互动体验，打破传统的轮次对话模式，允许 AI 主动参与对话，提升人机交互的自然度。通过多维度感知体系，AI 能够更好地理解用户意图和情感状态，推动更流畅的交流。

作者：周源/华尔街见闻

在 2025 世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2025）展览现场，社交平台 Soul App 展示了其自研的全双工通话大模型。

该模型即将在 Soul 平台开启内测，后续计划应用于虚拟人实时通话、AI 匹配等 1V1 及多对多互动场景，是社交领域的一项新探索。

就眼下 Soul 的 “虚拟人” 应对用户互动场景的表现来看，已深具 “真实感”，但这种互动目前仅限于文字形式。

此次推出自研全双工通话大模型，若能实现实时通话，则其智能性确然会有更大提升。

调整传统交互模式

传统语音交互长期依赖 VAD（话音活性检测）机制与延迟控制逻辑，形成轮次对话模式。

这种模式的人机对话，呈现一问一答刻板节奏：用户发言结束后，AI 才开始响应，中间存在明显延迟，影响了交互的自然性。

在很多时候，用户发言过程中会出现短暂停顿，这可能被系统误判为发言结束，导致 AI 过早介入，打断用户思路，交流显得过于生硬。

Soul 自研的端到端全双工语音通话大模型，对这一传统模式做了调整：不再采用 VAD 机制，尝试通过算法让 AI 自主把控对话节奏。

在实际交互中，AI 可实时监测对话动态，有能力做出主动打破沉默、适时打断用户、边听边说等操作。

比如，用户讲述事情时稍作停顿思考，AI 能察觉并非发言结束，补充引导性话语推动话题；在多人交流场景中，AI 能判断发言时机加入讨论，与用户发言相互交织，使对话更流畅，接近人与人面对面交流的状态。

在理论上，这种交互模式使 AI 从被动的回应者转变为主动的参与者，在一定程度上能提升人机对话的自然度。

为让 AI 在交互中更接近 “真人”，Soul 的全双工通话大模型构建了多维度感知体系，包括时间感知、环境感知、事件感知等。通过分析这些维度的信息，AI 试图更好地理解用户意图和情感状态，给出贴合情境的回应。

从时间感知来看，AI 会依据对话时间调整语言风格和话题。清晨可能以 “早上好，新的一天有什么安排吗？” 开启对话；深夜用户倾诉烦恼时，回应会更温柔，给予情感支持。

在环境感知上，模型能识别用户所处环境，嘈杂时适当提高音量保证清晰，安静时声音则更轻柔。

在事件感知方面，AI 能结合讨论的事件给出针对性观点。用户分享工作中完成重要项目时，AI 会表示祝贺并询问细节，增加对话的真实感。

此外，模型在口语化表达和音色复刻上做了优化：能模拟语气词、结巴、情绪起伏等日常口语特征，还可根据用户需求复刻特定音色。

还有情绪表达，AI 的声音情绪会随对话推进变化，用户分享喜悦时语调上扬，用户情绪低落时声音低沉关切。

这些处理在一定程度上提升了 AI 交互的真实感，但距离完全模拟真人还有差距，仍有较大的提升空间。

事实上，在该大模型推出前，Soul 虚拟人在 1V1 或在响应用户评论时的互动中，其表现也有较高的自然性和智能性。若 Soul 没有标注 “虚拟人” 标签，其应对内容已具有高度的 “真人” 感。

AI 推升电子社交真实性

全双工通话大模型在 Soul 平台的多个应用场景中得以应用，在 1V1 和多对多互动场景中，会对用户的社交体验产生影响。

在虚拟人实时通话场景中，该模型有望让虚拟人与用户的交流更自然。

以往虚拟人对话较刻板，有了这一模型后，虚拟人可实时捕捉用户情绪和话语变化，调整回应方式和语气，提供更个性化的陪伴服务，使用户感受到更真实的情感反馈。

在 AI 匹配的 1V1 互动场景中，模型发挥了怎样的作用？比如能通过算法帮助用户筛选契合的聊天对象，提高社交匹配效率。

在交流过程中，模型分析双方对话内容和情绪，适时提供话题建议或引导：当匹配双方初次交流出现冷场，AI 会抛出与双方兴趣相关的话题，如 “听说你们都喜欢摄影，最近有拍到满意的作品吗？” 打破僵局，让交流更顺畅。

在多人语音互动场景如群聊派对中，AI 主持人具备相应功能：用户进入群聊派对后，AI 主持人能管理群聊秩序，控制发言顺序、提醒文明交流，还能与用户语音互动。

当群内气氛沉闷时，发起如 “大家最近有看什么好电影，分享一下吧？” 的话题，吸引用户参与；新成员加入时，热情打招呼并引导相互认识，帮助新成员融入，在一定程度上可能提升群聊派对的参与度。

Soul 全双工通话大模型的出现，为自身平台发展带来了新的方向，也为 AI 社交行业提供了参考案例。

这个模型展示了 AI 技术在社交领域的一种应用可能：即通过技术创新突破传统交互限制，实现更自然的社交体验。

随着该技术的推广应用，其他社交平台可能会增加 AI 技术研发投入，探索将 AI 技术融入社交场景，推动行业技术发展。比如提升对话流畅性，或在多维度感知方面深入研究，增强社交体验的沉浸感。

Soul 的实践会吸引更多开发者关注 AI 社交领域，促使新的社交应用和服务出现。AI 社交的发展会影响人们的社交方式和观念，打破地域、时间限制，让人们更便捷地结识不同地区的朋友，拓展社交圈。

随着 AI 在社交中作用渐显，人们对 “社交” 的定义可能发生变化，更注重与 AI 及其他用户的情感共鸣和信息交流。

Soul 全双工通话大模型即将内测并应用，是 AI 社交领域的一次新尝试：凭借新的技术架构和应用场景，为用户带来新的社交体验，为行业发展提供思路。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

Track Hyper | Soul launches a full-duplex communication large model

调整传统交互模式​

AI 推升电子社交真实性​

调整传统交互模式

AI 推升电子社交真实性