如今,語音已經(jīng)成為萬物互聯(lián)時代人機交互的關(guān)鍵入口,在智能家居、智能汽車、穿戴式設備等場景不可或缺。我們看到的各類便捷的智能語音應用,背后是語音識別、語義理解、語音合成等技術(shù)的創(chuàng)新發(fā)展。在全球化的背景下,AI多語種智能技術(shù)被越來越多地應用于各行各業(yè)。
科大訊飛作為智能語音行業(yè)的執(zhí)牛耳者,在多語種智能語言技術(shù)上不斷進行技術(shù)創(chuàng)新和應用落地實踐,迎接市場環(huán)境變化下的新挑戰(zhàn)。7月15日,科大訊飛在武漢的“訊飛樂享A.I.技術(shù)沙龍”專場,面向開發(fā)者,對科大訊飛在AI+多語種智能語言技術(shù)上的研發(fā)、實踐、求索進行了全方位的解讀和分享。
科大訊飛多語種智能語言技術(shù)進展
活動開場,訊飛AI研究院副院長方昕帶來了《科大訊飛多語種智能語言技術(shù)進展與應用落地》的主題分享。在他看來,當下無論是從社會剛需應用場景,還是“一帶一路”等國家戰(zhàn)略、信息安全等方面考慮,布局多語種語音語言技術(shù)都顯得尤為重要。但是,如今多語種語言技術(shù)仍然面臨三大挑戰(zhàn):多語種語言分析研究和專家知識積累不足;多語種訓練數(shù)據(jù)稀缺,難以支撐大量語種系統(tǒng)研發(fā);技術(shù)級聯(lián)誤差擴散和眾多系統(tǒng)批量構(gòu)建難題。
對此,科大訊飛在數(shù)據(jù)、算法、平臺三個層面搭建了多語種智能語言技術(shù)創(chuàng)新技術(shù)框架,具體包括基于人機協(xié)同的多語種數(shù)據(jù)標注平臺,多語種端到端統(tǒng)一建??蚣?,無監(jiān)督/弱監(jiān)督模型訓練技術(shù),語音/圖片翻譯多任務協(xié)同優(yōu)化,以及多語種模型自動訓練及定制優(yōu)化平臺。
多語種智能語言技術(shù)的應用落地
隨著多語種技術(shù)的逐漸成熟以及各類型業(yè)務的國際化需求,科大訊飛始終堅持致力于多語種語音技術(shù)方案在各類型場景下的廣泛落地。那么訊飛的多語種技術(shù)目前在為哪些業(yè)務場景賦能?
訊飛AI多語種業(yè)務部總經(jīng)理周傳福表示:“整個語音的研究是多語種技術(shù)的底座,在這個底座的基礎(chǔ)上要真正把多語種落地到設備,真正落地到場景和應用中去,這個路非??部酪埠荛L,整個多語種在之前自有產(chǎn)品上,翻譯機已經(jīng)上線了不少語種,但是應用場景比較窄,所以我們把多語種技術(shù)用得更多更廣闊的市場范圍里,真正把多語種技術(shù)走出海外,應用在海外的各種設備上去?!?/p>
“目前整個多語種落地還是瞄準國內(nèi)出海的企業(yè),先跟國內(nèi)企業(yè)一起出海把語音技術(shù)真正落實到實際應用中去,下一步整個客戶會瞄準國際市場?!?019年至今,科大訊飛出海主要瞄準谷歌和亞馬遜等,想要在重點領(lǐng)域超過他們,引領(lǐng)海外語音市場。目前,科大訊飛基于核心技術(shù)做出的真正落地的解決方案,包括語音助手、智能家居、AI字幕、內(nèi)容審核等。
周傳福談道:“華為海外語種都是我們提供的,給華為這樣的大客戶交付項目難度是非常大要求也很高,涉及各個層面,我們目前在給華為做項目上獲得了非常高的評價,在交付方面我們非常有信心?!?/p>
多語種智能語言技術(shù)的場景化應用
在具體的場景中,科大訊飛多語種智能語言技術(shù)也獲得了來自合作伙伴的認可。以譯制行業(yè)為例。武漢譯滿天下科技有限公司產(chǎn)品經(jīng)理金煒龍表示,譯制領(lǐng)域的痛點有三:一是人工翻譯一部作品時需要來回切換軟件查詞,反復完整觀看視頻,翻譯效率低;二是原視頻沒有原文字幕,譯員需要先看一遍視頻,手動抄錄對話字幕、對準字幕時間軸;三是對已有內(nèi)嵌字幕的視頻進行字幕提取。
針對這些痛點,以及自身用戶體量較大的現(xiàn)狀,譯滿天下基于訊飛的機器翻譯服務,開發(fā)出一鍵翻譯功能,實現(xiàn)快速進行字幕翻譯和字幕制作;基于訊飛開放平臺的語言轉(zhuǎn)寫功能,一鍵完成人工填寫和打軸操作;基于訊飛開放平臺的印刷文字識別功能,加上自己的優(yōu)化算法,解決字幕提取和翻譯難題。
構(gòu)建訊飛AI生態(tài)藍圖,訊飛開放平臺
譯滿天下使用的訊飛開放平臺能力,背后是科大訊飛近幾年一直重點發(fā)力平臺+賽道的戰(zhàn)略。訊飛開放平臺承載著訊飛構(gòu)建訊飛AI生態(tài)藍圖,布局AI生態(tài)建設的野心。訊飛開放平臺產(chǎn)品總監(jiān)孫力健表示:“訊飛開放平臺把基于科大訊飛對于語音技術(shù)和語義理解和AIUI的研究,形成接口的形式對外開放,把一些在垂直行業(yè)沉淀的場景化的解決方案開放給大家?!睆?010年成立至今,訊飛開放平臺擁有330萬生態(tài)合作伙伴、433項AI能力及方案、連接31億終端。
“我們之前做的很多事情是把訊飛的語音技術(shù)、圖像AIUI、語義理解和翻譯放在開放平臺上給所有開發(fā)者和企業(yè)用,現(xiàn)在也會做一些偏平臺型的事情,我們愿意把一些根本的算法和平臺的東西開放出來,讓很多算法的研究人員也加入到這里來,讓他們把他們更好的東西放在我們這兒,得到更好地應用和推廣。”目前,訊飛開放平臺在招聘行業(yè)推出了全流程智能化招聘解決方案,在AI虛擬數(shù)字人上推出多語種環(huán)境下的實時展示。接下來,科大訊飛將在技術(shù)方向做投資孵化,希望通過生態(tài)建設連接頂尖AI能力和優(yōu)質(zhì)合作伙伴。
孫力健強調(diào):“無論你是什么角色或者有什么需求,都可以聯(lián)系我們,在我們開放平臺上一定會找到解決你現(xiàn)在需求的方案?!?/p>
武漢炎熱的天氣也擋不住現(xiàn)場開發(fā)者的熱情,訊飛樂享A.I.技術(shù)沙龍武漢“AI+多語種創(chuàng)新技術(shù)”專場圓滿結(jié)束,但訊飛開放平臺樂享A.I.技術(shù)沙龍系列活動還未結(jié)束。接下來,訊飛開放平臺樂享A.I.技術(shù)沙龍系列活動將繼續(xù)向全國各大重點城市出發(fā),圍繞AI熱點能力分享、行業(yè)應用探究和Workshop技術(shù)實踐等豐富形式,與各地開發(fā)者展開實地面對面交流,為大家提供最新的人工智能理念、產(chǎn)品技術(shù)、解決方案和實踐經(jīng)驗。
(通訊員:陳彤)
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )