Soul App 三大新功能亮相世界人工智能大會,展現(xiàn)“模應(yīng)一體”創(chuàng)新實(shí)踐

7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)正式開幕。今年主題為“以工商促共享 以善治促善智”,圍繞核心技術(shù)、智能終端、應(yīng)用賦能三大板塊,集中展示一批“人工智能+”創(chuàng)新應(yīng)用最新成果。作為當(dāng)下“AI+社交”領(lǐng)域代表,社交平臺Soul App受邀參展,并重點(diǎn)展出了“數(shù)字分身”“狼人魅影”和“異世界回響”等AI能力落地的新功能、新場景。

Soul App CTO陶明表示,“Soul圍繞社交場景中用戶的核心需求布局‘AIGC+社交’,開展語言、語音、視覺等多模態(tài)大模型自研工作的同時,快速推動大模型在社交場景的應(yīng)用。在‘模應(yīng)一體’方向下,致力于在社交體驗(yàn)提升、AI社交、AI游戲等多個維度探索 AI Native應(yīng)用的理想形態(tài)?!?/p>

三大新功能亮相,集中展現(xiàn)多模態(tài)互動能力

在WAIC 2024活動現(xiàn)場,Soul App以“科技無界,心與智連”為主題呈現(xiàn)展臺,并重點(diǎn)展示了“數(shù)字分身”“狼人魅影”和“異世界回響”三個新功能/場景,這也是Soul在探索“AIGC+社交”場景深度融合的最新實(shí)踐。

其中,“數(shù)字分身”致力于幫助用戶打造虛擬數(shù)字人,實(shí)現(xiàn)高效社交。用戶可以直接授權(quán)平臺基于聊天記錄、發(fā)帖內(nèi)容,或者以自定義方式,設(shè)置數(shù)字分身的形象和特征,在人設(shè)、圖像、聲音等豐富維度上,使數(shù)字分身達(dá)到最大程度復(fù)刻真人的效果。

堅(jiān)持興趣社交,Soul平臺不支持使用真人頭像,用戶通過捏臉系統(tǒng)為自身打造虛擬形象在數(shù)字空間進(jìn)行互動。如今,具備私聊輔助能力的“數(shù)字分身”上線,不僅可以幫助用戶打造更理想的“另一個自己”,也能實(shí)現(xiàn)更個性化、更千人千面的智能回復(fù)推薦,幫助用戶進(jìn)行社交破冰,在助力人設(shè)搭建和認(rèn)知決策中,提升社交溝通效率。

而游戲互動場景“狼人魅影”中引入的AI 智能體,則集中展現(xiàn)了大模型的多模態(tài)互動能力。在該場景中,用戶可以選擇任意的AI+真人游戲組合模式開啟互動,與具備自主推理、發(fā)言、“偽裝”的AI一起進(jìn)行真實(shí)游戲?qū)Q。而“AI游戲陪玩師”也能幫助玩家快速適應(yīng)門檻相對較高、玩法復(fù)雜的狼人游戲,輕松開啟交流互動,在更沉浸、即時的交互中獲得趣味體驗(yàn)。

在站內(nèi)場景融入AI能力的同時,Soul還上線了獨(dú)立新產(chǎn)品“異世界回響”。該產(chǎn)品定位為AI社交平臺,用戶可與虛擬角色進(jìn)行沉浸式即時交流,還可根據(jù)喜好自定義角色人設(shè),實(shí)現(xiàn)不同的對話風(fēng)格,人物的形象可通過文字描述或上傳心儀的圖片生成,平臺提供多種基礎(chǔ)音色,用戶可自行創(chuàng)建、融合出屬于該角色的專屬聲音,實(shí)現(xiàn)多模態(tài)互動。

“模應(yīng)一體”實(shí)踐,從社交提效到人機(jī)互動新體驗(yàn)

在活動現(xiàn)場,觀眾可體驗(yàn)與“異世界回響”中的虛擬角色進(jìn)行實(shí)時通話?!皳芡ā彪娫捄?,具備類真人音色的虛擬角色實(shí)時回應(yīng)對話,并自然地進(jìn)行交流互動,實(shí)現(xiàn)了即時的“跨次元”通話。

在這背后是Soul最新升級的語音大模型。事實(shí)上,作為較早開始思考將AI應(yīng)用于社交領(lǐng)域的平臺,Soul在2016年上線后,便開始了圍繞AI的底層技術(shù)和應(yīng)用落地的探索。

例如,平臺通過推出基于用戶站內(nèi)全場景畫像的智能推薦引擎“靈犀”,以去中心化機(jī)制幫助用戶找到興趣相同的人,平等地實(shí)現(xiàn)多元關(guān)系建立和即時的情緒反饋,切實(shí)提升用戶體驗(yàn)。此外,平臺的NAWA引擎能夠幫助用戶打造個性化的虛擬形象和場景,實(shí)現(xiàn)沉浸式互動。

2020年,Soul啟動了對AIGC的系統(tǒng)研發(fā)工作,并在智能對話、圖像生成、語音技術(shù)(如語音生成、音樂生成、語音動畫等)等方面擁有了前沿能力積累。2023年,Soul上線自研垂類語言大模型Soul X,該模型具備prompt驅(qū)動、條件可控生成、上下文理解、多模態(tài)理解等能力,能夠?qū)崿F(xiàn)有情感、有溫度的交互。

2024年,Soul語音生成大模型上線,同時自研語音大模型正式升級。現(xiàn)階段,Soul語音大模型包括了語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等,可支持真實(shí)音色生成、語音DIY、多語言切換、多情感擬真人實(shí)時對話等能力。

Soul在語言、語音、視覺等方向自研大模型的同時,實(shí)現(xiàn)的多模態(tài)互動能力也快速融入到包括Soul “AI茍蛋”、狼人魅影、數(shù)字分身、異世界回響等具體的應(yīng)用場景中,進(jìn)一步實(shí)現(xiàn)交互效率、交互質(zhì)量、交互體驗(yàn)、交互對象等多方面的提升和拓展,也受到了用戶的歡迎和認(rèn)可。

數(shù)據(jù)顯示,用戶平均每天會給AI茍蛋發(fā)送超過70條消息,互動平均時長超過30分鐘。此外,AI茍蛋也會經(jīng)常更新相關(guān)話題的瞬間,和用戶互動,收到大量用戶的點(diǎn)贊、評論和轉(zhuǎn)發(fā)。

“用戶愿意持續(xù)與AI進(jìn)行對話交互,這已經(jīng)證明了對平臺提供體驗(yàn)的認(rèn)可,也表明了Soul堅(jiān)持‘模應(yīng)一體’方向的可持續(xù)性。”Soul App CTO陶明表示,AI對于Soul就像是為釘子找到了合適的錘子,“Soul是當(dāng)下最受年輕人歡迎的互聯(lián)網(wǎng)平臺之一,是天然的應(yīng)用場景和流量入口,我們的優(yōu)勢便是能夠在場景中發(fā)現(xiàn)用戶實(shí)際需求,大模型落地應(yīng)用也能第一時間面向用戶獲得反饋,快速驗(yàn)證、迭代,這也確保了Soul在深化‘AIGC+社交’戰(zhàn)略中的不斷前進(jìn)?!?/p>

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-07-05
Soul App 三大新功能亮相世界人工智能大會,展現(xiàn)“模應(yīng)一體”創(chuàng)新實(shí)踐
SoulApp三大新功能亮相世界人工智能大會,展現(xiàn)“模應(yīng)一體”創(chuàng)新實(shí)踐

長按掃碼 閱讀全文