科大訊飛發(fā)布iFLYHOME OS 2.0 為智慧家庭生態(tài)賦能升級

11月19日,第五屆世界聲博會暨2022科大訊飛全球1024開發(fā)者節(jié)AI+家庭論壇在合肥奧體中心舉辦,現(xiàn)場發(fā)布推出以AI虛擬數(shù)字人為媒介的新一代電視語音平臺——iFLYHOME OS 2.0。iFLYHOME OS是科大訊飛針對家庭場景及智能終端開發(fā)的AI多模態(tài)人工智能操作系統(tǒng)。此次iFLYHOME OS 2.0以AI虛擬數(shù)字人為媒介,對多模態(tài)交互系統(tǒng)進行了全面能力提升,并帶來了三大創(chuàng)新亮點,讓大屏交互更便捷、更智慧、更溫暖。

伴隨智能終端和ICT技術(shù)的蓬勃發(fā)展,智慧家庭新時代正在撲面而來。2021年12月,業(yè)內(nèi)首個雙編號標準《智能家居系統(tǒng)跨平臺接入與身份驗證技術(shù)要求》正式發(fā)布,有效解決當前智能家居互聯(lián)互通中存在的“生態(tài)壁壘”問題,助推智能家居互聯(lián)互通產(chǎn)業(yè)的進一步規(guī)范發(fā)展。面對廣闊前景空間,智慧家庭市場將深度聚焦平臺、應用、技術(shù)、場景探索智慧家庭生態(tài)構(gòu)建,不斷完善服務化水平。 

訊飛智慧家庭作為科大訊飛垂直行業(yè)品牌,以人工智能技術(shù)深度賦能運營商數(shù)字家庭業(yè)務及終端設(shè)備。在2016年發(fā)布首款電視語音助手,開啟大屏入口探索,2020發(fā)布電視語音平臺iFLYHOME OS,聚焦平臺生態(tài)能力建設(shè)。此次發(fā)布的iFLYHOME OS 2.0則標志著大屏交互從語音邁入多模態(tài)新時代。

關(guān)鍵核心技術(shù)突破帶來交互體驗升級

全新發(fā)布的iFLYHOME OS 2.0在語音識別、語音合成和端到端交互成功率方面都有顯著效果提升。在平臺系統(tǒng)化布局基礎(chǔ)上,每個單點性能的提升都能給用戶帶來極大的交互體驗改變。

其一,面向家庭復雜環(huán)境和人群的識別優(yōu)化,讓語音交互更簡單。科大訊飛在語音識別方面取得關(guān)鍵技術(shù)突破,通過增強模型和識別模型的深度耦合,實現(xiàn)高噪、遠場混響等各種復雜環(huán)境下的高精度語音識別。即使在客廳和廚房這種高噪音復雜場景下,升級優(yōu)化的語音識別可以精準識別到家庭用戶的指令詞。同時,iFLYHOME OS 2.0針對各種方言和口音也能實現(xiàn)復雜場景高魯棒性語音識別,支持7種方言自由切換,滿足家庭多代同堂的“年輕人普通話&老人方言”混合識別問題。

其二,極致擬人的語音合成,讓AI虛擬人交互更有情感。科大訊飛最新一代語音合成技術(shù)在深度學習框架的基礎(chǔ)上進行了技術(shù)升級,結(jié)合無監(jiān)督語音聽感屬性解耦和聽感量化編碼技術(shù),實現(xiàn)對語音韻律和情感的精細化建模,從而達到能夠媲美真人細膩情感表達的效果,使得合成語音變得更具有表現(xiàn)力,韻律、音質(zhì)和情感上都要更加貼近真人。目前,iFLYHOME OS 2.0定制化音庫中有十多種超自然發(fā)音人選擇,家庭用戶可以根據(jù)年齡、性別、場景喜好定制專屬自己的發(fā)言人陪自己對話聊天。

其三,交互全流程評價體系打造,讓端到端體驗更完善。針對平臺交互評價標準,科大訊飛聯(lián)合中國移動智慧家庭運營中心和福建移動分公司,在iFLYHOME OS首發(fā)“懂有暢快暖”語音評價體系,不同于現(xiàn)有行業(yè)通用的識別率、語義分析等偏技術(shù)化和分段碎片化的評價體系。iFLYHOME OS 2.0聚焦家庭用戶交互全流程,從用戶語音需求出發(fā),注重整體體驗感的提升,從單一搜索服務擴充到全場景交互服務,為家庭用戶帶來更人性化的智能操控體驗,獲取信息更快、更準、更智能。將端到端交互成功率提升到90%以上,為行業(yè)平臺交互應用提供標準參考。

- 懂-聽得懂:聚焦語音交互服務,提升“識別-語義-搜索”全流程交互滿足率,保障用戶基礎(chǔ)體驗,保障用戶基礎(chǔ)體驗。

- 有-服務多:結(jié)合大屏場景及人群特征,打造100+精品技能。

- 暢-推得準:針對現(xiàn)網(wǎng)普遍30%+的影片缺失率問題,形成“用戶搜索時給予推薦、搜索后后臺統(tǒng)計、資源更新后用戶提醒”的閉環(huán)

- 快-速度快:通過搜索邏輯與界面展示流程優(yōu)化,全流程響應時間在1S內(nèi)。

- 暖-有情感:通過交互流暢性、視覺效果、合成音效果、回復語人性化程度、用戶引導等功能優(yōu)化。

(以上數(shù)據(jù)來源:訊飛電視語音平臺BI數(shù)據(jù))

、

智慧家庭道路上,科大訊飛始終堅持從技術(shù)中來,到產(chǎn)品中去。目前,科大訊飛已成功構(gòu)建一套“AI+家庭”智能化解決方案。相信,基于iFLYHOME OS 2.0的升級迭代,訊飛將持續(xù)賦能智慧家庭生態(tài),圍繞家庭場景的多樣化需求,技術(shù)連接家庭內(nèi)的智能終端,并通過開展多元化運營,給家庭用戶帶去多模態(tài)、主動式的交互體驗。

更溫暖、更精準、更安全的大屏應用創(chuàng)新

iFLYHOME OS 2.0也在場景應用方面有所突破創(chuàng)新,家庭用戶體驗感提升,大屏語音交互更溫暖、更精準、更安全。

其一,基于場景的情感型對話,讓大屏交互更溫暖。相比對傳統(tǒng)的指令性交互,必須等待用戶主動說話然后系統(tǒng)進行機械師回復的方式,家庭用戶對大屏交互提出更高層次的要求??拼笥嶏w通過多模態(tài)感知及表達、主動對話等技術(shù)賦能,在iFLYHOME OS 2.0上升級AI交互對話系統(tǒng)能力,系統(tǒng)會在合適的場景下主動進行電視助手的關(guān)懷引導和情感化表達,如用戶之前搜索的缺失影片更新上映了,系統(tǒng)會主動進行提醒,實現(xiàn)熱門影片推薦服務閉環(huán)。

經(jīng)過多年深耕,iFLYHOME OS 2.0已經(jīng)擁有一整套家庭垂直領(lǐng)域知識圖譜,覆蓋衣食住行文購娛樂等家庭生活全場景。通過AI對話系統(tǒng)深度學習,會在和用戶對話的過程中,結(jié)合用戶的對話內(nèi)容,進行電視內(nèi)容和服務的推薦,將電視端的內(nèi)容和服務推薦給家庭用戶使用,從簡單指令逐漸提升到智能服務的層次。

其二,面向多人場景的“圖像+聲音”多模態(tài)融合,讓遠場交互更精準。現(xiàn)在很多電視、音箱的遠場交互都是依賴“單語音+喚醒詞”的方式進行,一來這種方式需要用戶頻繁進行喚醒詞喚醒,每說一句話都要喊一次,非常繁雜;二來客廳環(huán)境經(jīng)常有各種人聲、電視背景音、甚至窗外的雜音等,會影響遠場語音的識別效果。

iFLYHOME OS 2.0通過“圖像+聲音”多模態(tài)融合技術(shù),可利用遠場麥克風陣列搭配攝像頭,實現(xiàn)遠場聲音定位+攝像頭的人臉和唇形檢測,視覺+聽覺雙重信息進行說話人和內(nèi)容解析,既解決每次說話需要喊喚醒詞的繁瑣操作,也做到即使旁邊有其他人說話,也能將主說話人的干凈人聲從嘈雜背景環(huán)境中分離出來,提升在多人、遠距離復雜場景下的語音交互精準性。有了這種技術(shù),以后即使客廳有再多人,電視也能做到只“聽”你的聲音,隨時隨地和你實時互動。

其三,多場景輸入輸出的定向優(yōu)化,大屏輕社交方案更安全。iFLYHOME OS 2.0上線大屏輕交互解決方案,可實現(xiàn)大屏彈幕和大屏字幕翻譯功能。針對大屏彈幕功能,上線組合敏感詞識別、基于語義的敏感內(nèi)容識別,敏感詞過濾保障大屏內(nèi)容安全。另外,字幕在線翻譯支持中文和英語等四十多個語種的互相翻譯,實施率和準確率高達99%,讓大屏視頻觀看實時無障礙。

首款大屏AI虛擬人開啟家庭“元宇宙”

在本次發(fā)布會上,訊飛智慧家庭還推出了大屏首款情感陪伴AI虛擬人。作為一款兼具情感交互和工具服務的AI虛擬人,AI虛擬管家可以實現(xiàn)與家庭用戶在情感陪伴、影視娛樂、老人健康、兒童成長、生活服務、AIoT等多個場景生態(tài)下的實時交互,為用戶提供一站式大屏生活服務。

AI虛擬管家的多情緒識別和表達能力表現(xiàn)出色,能夠根據(jù)家庭用戶的意圖,主動推薦內(nèi)容及服務。從語音交互再到“類人化”交互,AI虛擬管家越來越接近人與人的對話習慣,也更加適合多樣化的現(xiàn)代家庭。

基于iFLYHOME OS 2.0的發(fā)布,科大訊飛依舊秉承著開放共贏的合作理念,面向行業(yè)和合作伙伴提供標準化對接接口,實現(xiàn)高效技術(shù)保障。并且面向多種應用場景實現(xiàn)我們的場景開放,向行業(yè)提供多種場景提供帶屏解決方案。

面對現(xiàn)下元宇宙背景下的“虛擬人”熱潮,科大訊飛誠邀產(chǎn)業(yè)合作伙伴共建虛擬人生態(tài),基于訊飛AI虛擬人交互平臺,為客戶提供定制虛擬人解決方案。訊飛希望聯(lián)手運營商和合作伙伴,通過iFLYHOME OS 2.0平臺,不斷創(chuàng)造并完善更多的數(shù)字家庭新場景。

作為AI虛擬人技術(shù)及相關(guān)產(chǎn)品和生態(tài)合作的服務平臺,訊飛AI虛擬人交互平臺具備多模感知、多維表達、情感貫穿、自主定制四大關(guān)鍵特點。2022年6月,科大訊飛AI虛擬人交互系統(tǒng)通過國內(nèi)首批數(shù)字人系統(tǒng)基礎(chǔ)能力評測,成功獲得了數(shù)字人領(lǐng)域的權(quán)威標準認證,為和產(chǎn)業(yè)鏈合作伙伴合作奠定深厚的技術(shù)基礎(chǔ)。

iFLYHOME OS 2.0的發(fā)布是科大訊飛穩(wěn)步布局智慧家庭生態(tài)布局的重要一步。面對智慧家庭產(chǎn)業(yè)市場藍海,科大訊飛將會繼續(xù)以技術(shù)創(chuàng)新為動力進行探索,推動未來家庭生活逐步走向智能化。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-11-22
科大訊飛發(fā)布iFLYHOME OS 2.0 為智慧家庭生態(tài)賦能升級
11月19日,第五屆世界聲博會暨2022科大訊飛全球1024開發(fā)者節(jié)AI+家庭論壇在合肥奧體中心舉辦,現(xiàn)場發(fā)布推出以AI虛擬數(shù)字人為媒介的新一代電視語音平臺——

長按掃碼 閱讀全文