日前,華為云聯(lián)合英國AI公司Emotech ,在2019 HUAWEI CONNECT(華為全聯(lián)接大會)上首發(fā)全球首個多模態(tài)AI英語口語教評解決方案,將人工智能的自然語言處理技術(shù)與多模態(tài)技術(shù)相結(jié)合,賦能英語口語教育,助力教育產(chǎn)業(yè)良性發(fā)展。
超越真人教學(xué),AI比老師更懂你
口語一直是外語學(xué)習(xí)中的重點。今天,英語學(xué)習(xí)者渴望更高智能、更低成本的口語學(xué)習(xí)方式,眾多教育機(jī)構(gòu)也希望獲得更具標(biāo)準(zhǔn)化的知識傳授助手。
“作為傳統(tǒng)單一模態(tài)(語音、視覺)的升級性底層技術(shù),多模態(tài)技術(shù)能整合語音、文字、空間等多重數(shù)據(jù)與分析,并結(jié)合深度學(xué)習(xí),提供更還原人類自然交互的算法與應(yīng)用”,Emotech創(chuàng)始人莊宏斌介紹說。
此次華為云與Emotech聯(lián)合推出的多模態(tài)AI英語口語教評解決方案,覆蓋了英語口語從學(xué)習(xí)、練習(xí)、測評到改進(jìn)的方方面面,效果如同真人老師一對一教學(xué),提升學(xué)習(xí)效率。用戶讀出句子,就能得到每句話、每個單詞、甚至每個音素的發(fā)音評分結(jié)果;通過視頻與音頻抓取、回放自讀視頻,每個不標(biāo)準(zhǔn)的發(fā)音都能被精確識別并鎖定原因;觀看AI助教提供的標(biāo)準(zhǔn)發(fā)音示范以及比對,計算機(jī)視覺能實時追蹤重點強(qiáng)化口型變化,加速口音改進(jìn);每一次的學(xué)習(xí)過程都能被記錄下來,并且利用深度學(xué)習(xí)功能實時獲得AI測評報告,為后續(xù)個性化針對教育提供基礎(chǔ)與動態(tài)參考。
華為全聯(lián)接大會多模態(tài)AI口語教室展臺
此次推出的解決方案還具備強(qiáng)大的抗噪能力,適用于各種環(huán)境,有效提高了發(fā)音評測系統(tǒng)(PA)、語音識別( ASR)的準(zhǔn)確率,在給定噪音環(huán)境下,與單模態(tài)產(chǎn)品相比,它的準(zhǔn)確率提高了30%以上。
隨著5G以及AI芯片的發(fā)展,未來越來越多的場景中可以用到多模態(tài)技術(shù)。華為云與Emotech計劃在更多領(lǐng)域進(jìn)行多感官綜合應(yīng)用的探索和嘗試。
自然語言處理及多模態(tài)AI技術(shù)賦能英語教育
華為云語音語義負(fù)責(zé)人表示,這是一次AI技術(shù)領(lǐng)域的強(qiáng)強(qiáng)聯(lián)合,“Emotech在語音和多模態(tài)AI方面有先進(jìn)的技術(shù),華為云擁有全棧的AI平臺,并在自然語言處理領(lǐng)域有深厚的積累和實踐,擁有多項領(lǐng)先業(yè)界的創(chuàng)新技術(shù)。雙方聯(lián)合研發(fā)并取得一定突破,這是個非常好的開始。期待我們的產(chǎn)品能夠幫助數(shù)以千萬計的英文學(xué)習(xí)者。”
目前,華為云語音語義服務(wù)包括語音識別、語音合成、自然語言處理基礎(chǔ)、語言理解、語言生成、機(jī)器翻譯、知識圖譜、對話機(jī)器人等子服務(wù),支持語音助手、智能客服、外呼機(jī)器人、輿情分析等多個應(yīng)用,覆蓋汽車、能源、保險、金融等多個行業(yè)。例如,基于華為云對話機(jī)器人服務(wù)的智能客服,幫助蒙牛更好地服務(wù)大眾消費者;基于華為云知識圖譜的油氣層識別,幫助中石油降本增效,更好地保障國家能源安全。全聯(lián)接大會期間,華為云還發(fā)布了業(yè)界第一個全棧全生命周期的領(lǐng)域知識圖譜構(gòu)建平臺云服務(wù)。
聯(lián)合國科教文組織(UNESCO)人工智能主席、倫敦大學(xué)學(xué)院計算統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)中心主任John Shawe-Taylor教授肯定了方案中多模態(tài)技術(shù)在教育的應(yīng)用,評價說:“多模態(tài)是一種可以接收來自多種感官系統(tǒng)的信息流后進(jìn)行處理分析的技術(shù),從而讓人工智能對周圍的世界獲得更深入,更真實,也更準(zhǔn)確的理解。事實上,調(diào)用多個感官來構(gòu)建對世界的認(rèn)知,增加對事物的理解,是讓人類在出生后能夠更快速學(xué)習(xí)新事物和技能的關(guān)鍵。Emotech巧妙地利用了這個原理,在對話分析中引入了聲音和視覺等多個感官維度,有效地分離了噪音等其他環(huán)境干擾因素,從而大幅提升了語音的質(zhì)量。我認(rèn)為這是非常重要的一項技術(shù)。”
- TikTok重返大陸:蘋果谷歌微軟商店仍拒上架,難題待解
- 諾基亞高管預(yù)言:iPhone初代失策,蘋果終墜神壇?
- 零一萬物CEO李開復(fù)自曝鐵人秘訣,揭秘不用睡覺的創(chuàng)業(yè)人生
- 中國商飛:C919預(yù)計2025年產(chǎn)能翻倍,下線量達(dá)30架,挑戰(zhàn)與機(jī)遇并存
- 高鐵錯車錯站別慌張,官方解答:遇到這種情況別重購!
- 搶票軟件:成功率是營銷術(shù),加速包只是噱頭,小心踩坑
- 馬斯克揭露TikTok與X的運(yùn)營差異:T獨霸美國,X卻難入中國
- 蘋果官網(wǎng)鬧烏龍,iPhone竟寫錯成“iPone”,消費者質(zhì)疑引發(fā)輿論風(fēng)波
- 亞馬遜AWS失去中國大客戶,金蝶轉(zhuǎn)向國內(nèi)云,云端之戰(zhàn)新格局揭曉
- 蘋果“血礦”案比利時啟動刑事調(diào)查:揭開科技巨頭背后的秘密?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。