☰

Soul App公布自研多模态大模型最新进展

来源：环球网

【环球网科技报道记者李文瑶】10月16日消息，在迪拜举办的GITEX GLOBAL海湾信息技术博览会上，新型社交平台Soul App对外展示最新自研多模态大模型。据了解，该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。用户可以通过数字装置，即时生成3D虚拟数字分身，通过实时动作捕捉与还原，体验自然、流畅、沉浸式的多模态互动。

Soul App方面表示，在现阶段，Soul 3D虚拟人能力已经实现全面升级，形成了成熟的集成3D虚拟人能力的多模态AI交互方案——即集合文字、语音、动作交互的多模态大模型方向，实现更接近人类模式的互动体验和更高效、自然、丰富维度的信息传递。

目前，Soul已先后上线了自研语言大模型Soul X，以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年6月，Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型，具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点，能够直接理解丰富的声音世界，支持超拟人化的多风格语言，实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

接下来，通过最新集成的3D虚拟人能力和多模态端到端大模型的AI交互方案，Soul用户自主打造的3D虚拟人，可以作为数字世界的多模态全能助手，在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节，拓展新关系的同时，提供高质量、趣味性、沉浸式的人机交互体验，反馈真实、自然的情感陪伴。

Soul App CTO陶明表示：“作为天然的流量聚集地和交互入口，社交被视为AI率先落地的最佳场景之一。我们将围绕用户的实际社交需求和具体社交场景，持续加大对AI技术的投入，给用户带来长期的可持续的价值。预计今年年底，Soul多模态端到端大模型将再次升级，推出全双工视频通话能力，让用户可以真正便捷、自然地体验到包括文字、语音、视觉在内的多模态创新交互。”

Soul App公布自研多模态大模型最新进展

相关资讯