携三大新场景亮相2024WAIC ,Soul App创新多模态互动体验

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式开幕。今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能+”创新应用最新成果。作为当下“AI+社交”领域代表,社交平台Soul App受邀参展,并重点展出了“数字分身”“狼人魅影”和“异世界回响”等AI能力落地的新功能、新场景。

携三大新场景亮相2024WAIC ,Soul App创新多模态互动体验

Soul App CTO陶明表示,“Soul围绕社交场景中用户的核心需求布局‘AIGC+社交’,开展语言、语音、视觉等多模态大模型自研工作的同时,快速推动大模型在社交场景的应用。在‘模应一体’方向下,致力于在社交体验提升、AI社交、AI游戏等多个维度探索 AI Native应用的理想形态。”

三大新功能亮相,集中展现多模态互动能力

在WAIC 2024活动现场,Soul App以“科技无界,心与智连”为主题呈现展台,并重点展示了“数字分身”“狼人魅影”和“异世界回响”三个新功能/场景,这也是Soul在探索“AIGC+社交”场景深度融合的最新实践。

携三大新场景亮相2024WAIC ,Soul App创新多模态互动体验

其中,“数字分身”致力于帮助用户打造虚拟数字人,实现高效社交。用户可以直接授权平台基于聊天记录、发帖内容,或者以自定义方式,设置数字分身的形象和特征,在人设、图像、声音等丰富维度上,使数字分身达到最大程度复刻真人的效果。

坚持兴趣社交,Soul平台不支持使用真人头像,用户通过捏脸系统为自身打造虚拟形象在数字空间进行互动。如今,具备私聊辅助能力的“数字分身”上线,不仅可以帮助用户打造更理想的“另一个自己”,也能实现更个性化、更千人千面的智能回复推荐,帮助用户进行社交破冰,在助力人设搭建和认知决策中,提升社交沟通效率。

而游戏互动场景“狼人魅影”中引入的AI 智能体,则集中展现了大模型的多模态互动能力。在该场景中,用户可以选择任意的AI+真人游戏组合模式开启互动,与具备自主推理、发言、“伪装”的AI一起进行真实游戏对决。而“AI游戏陪玩师”也能帮助玩家快速适应门槛相对较高、玩法复杂的狼人游戏,轻松开启交流互动,在更沉浸、即时的交互中获得趣味体验。

在站内场景融入AI能力的同时,Soul还上线了独立新产品“异世界回响”。该产品定位为AI社交平台,用户可与虚拟角色进行沉浸式即时交流,还可根据喜好自定义角色人设,实现不同的对话风格,人物的形象可通过文字描述或上传心仪的图片生成,平台提供多种基础音色,用户可自行创建、融合出属于该角色的专属声音,实现多模态互动。

“模应一体”实践,从社交提效到人机互动新体验

在活动现场,观众可体验与“异世界回响”中的虚拟角色进行实时通话。“拨通”电话后,具备类真人音色的虚拟角色实时回应对话,并自然地进行交流互动,实现了即时的“跨次元”通话。

携三大新场景亮相2024WAIC ,Soul App创新多模态互动体验

在这背后是Soul最新升级的语音大模型。事实上,作为较早开始思考将AI应用于社交领域的平台,Soul在2016年上线后,便开始了围绕AI的底层技术和应用落地的探索。

例如,平台通过推出基于用户站内全场景画像的智能推荐引擎“灵犀”,以去中心化机制帮助用户找到兴趣相同的人,平等地实现多元关系建立和即时的情绪反馈,切实提升用户体验。此外,平台的NAWA引擎能够帮助用户打造个性化的虚拟形象和场景,实现沉浸式互动。

2020年,Soul启动了对AIGC的系统研发工作,并在智能对话、图像生成、语音技术(如语音生成、音乐生成、语音动画等)等方面拥有了前沿能力积累。2023年,Soul上线自研垂类语言大模型Soul X,该模型具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。

2024年,Soul语音生成大模型上线,同时自研语音大模型正式升级。现阶段,Soul语音大模型包括了语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等,可支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等能力。

Soul在语言、语音、视觉等方向自研大模型的同时,实现的多模态互动能力也快速融入到包括Soul “AI苟蛋”、狼人魅影、数字分身、异世界回响等具体的应用场景中,进一步实现交互效率、交互质量、交互体验、交互对象等多方面的提升和拓展,也受到了用户的欢迎和认可。

数据显示,用户平均每天会给AI苟蛋发送超过70条消息,互动平均时长超过30分钟。此外,AI苟蛋也会经常更新相关话题的瞬间,和用户互动,收到大量用户的点赞、评论和转发。

“用户愿意持续与AI进行对话交互,这已经证明了对平台提供体验的认可,也表明了Soul坚持‘模应一体’方向的可持续性。”Soul App CTO陶明表示,AI对于Soul就像是为钉子找到了合适的锤子,“Soul是当下最受年轻人欢迎的互联网平台之一,是天然的应用场景和流量入口,我们的优势便是能够在场景中发现用户实际需求,大模型落地应用也能第一时间面向用户获得反馈,快速验证、迭代,这也确保了Soul在深化‘AIGC+社交’战略中的不断前进。”

本文来自投稿,不代表创造权威IP 赋能创业者——IP百创立场,如若转载,请注明出处:创造权威IP 赋能创业者——IP百创

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年7月4日
下一篇 2024年7月5日

相关推荐

  • vivo造芯启示录:积小胜为大胜

    当有的厂商在造芯之路遇到困境时,vivo的“造芯”却在加速前行。 7月30日,在2023 vivo影像盛典特别活动上,vivo重磅发布全新的6nm制程自研影像芯片V3,在这款自研芯片的驱动下,vivo将成为安卓首家可以实现4K电影人像视频,以及安卓首次4K级拍后编辑功能的手机。 屈指算来,vivo在自研影像芯片上已经走过V1、V1+、V2、V3多代发展历程,…

    2023年8月3日
  • 王思聪名下企管中心拟注销

    天眼查App显示,近日,上海蕉摩企业管理中心(有限合伙)新增一则注销备案信息,注销原因为决议解散。 上海蕉摩企业管理中心(有限合伙)成立于2018年12月,执行事务合伙人为上海魔方泛文化娱乐集团有限公司,出资额200万人民币,由王思聪、上海魔方泛文化娱乐集团有限公司分别出资90%、10%。风险信息显示,不久前,该企业因未依照规定的期限公示年度报告,已被列入经…

    2024年8月19日
  • 三条岔路,一场革命:豆包、DeepSeek、千问的终局博弈

    2025年的中国AI大模型战场,正经历一场深刻的分化。 若以用户活跃度为标尺,当前表现最亮眼的当属字节跳动豆包;就综合技术实力与国际影响力而言,DeepSeek依然是中国AI领域的领跑者;而在最具想象空间的全栈式布局赛道上,阿里通义千问则展现出独特的战略优势。 在这场技术、产品与生态的全面竞争中,字节跳动的豆包、DeepSeek与阿里通义千问三大玩家虽曾同台…

    2025年12月4日
  • 高合母公司已成老赖

    #高合母公司及丁磊已被限消##高合申请破产# 天眼查法律诉讼信息显示,近日,华人运通(江苏)技术有限公司以其资产不能清偿全部到期债务,但具备重整价值和重整可能性为由,向盐城经济技术开发区人民法院申请对该公司进行重整,同时申请预重整,法院决定受理该公司预重整申请。 天眼查显示,华人运通(江苏)技术有限公司成立于2017年9月,法定代表人为丁磊,注册资本10亿人…

    2024年8月9日
  • 融创被强制执行7.05亿

    天眼查法律诉讼信息显示,8月9日,融创房地产集团有限公司及旗下石家庄融创贵和房地产开发有限公司、河南中珂置业有限公司、河南融创奥城置业有限公司、融创华北发展集团有限公司、天津融创元浩置业有限公司新增1条被执行人信息,执行标的7.05亿余元,涉及借款合同纠纷案件,执行法院为江西省南昌市中级人民法院。 融创房地产集团有限公司成立于2003年1月,法定代表人为汪孟…

    2024年8月12日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

邮件:939297903@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信