思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)全場(chǎng)景應(yīng)用,識(shí)別體驗(yàn)持續(xù)提升!

“07---讀洞拐”

“什么是皰疹---什么是PORT”

“導(dǎo)航去fu南電視臺(tái)---導(dǎo)航去湖南電視臺(tái)”

“介個(gè)東西是我的---這個(gè)東西是我的”

人機(jī)自由交流的前景是漫長而漸進(jìn)的,語音識(shí)別技術(shù)在細(xì)分場(chǎng)景持續(xù)落地,需要“因地制宜”提升識(shí)別效果。

01語音識(shí)別的“三大考驗(yàn)”

噪聲環(huán)境。目前對(duì)語音識(shí)別效果影響最大的就是環(huán)境雜音或噪音,在公共場(chǎng)所中,來自四面八方的聲音會(huì)讓識(shí)別系統(tǒng)不知所措,實(shí)驗(yàn)室環(huán)境下的優(yōu)異表現(xiàn)可能在實(shí)際應(yīng)用場(chǎng)景中被“吊打”。例如在高鐵、地鐵、公交等交通場(chǎng)景下,多種混合噪聲降低了識(shí)別效果,進(jìn)而影響用戶在詢路、購票、換乘過程中的交互體驗(yàn)。

專業(yè)術(shù)語。大多數(shù)垂直應(yīng)用場(chǎng)景都有自身的專業(yè)術(shù)語和指代用詞,例如醫(yī)療場(chǎng)景中病癥、醫(yī)藥名,門店銷售場(chǎng)景中的奢侈品牌名稱、型號(hào),公安審訊場(chǎng)景中的敏感詞匯,會(huì)議場(chǎng)景中的人名、地名等等,要求語音系統(tǒng)適應(yīng)各種領(lǐng)域,還能準(zhǔn)確識(shí)別特殊用詞不是件容易事。

多語言混合識(shí)別。“你好小馳,hu(福)建今天天氣怎么樣?那fu(湖)南呢?”識(shí)別方言口音在生活中隨處可見,伴隨著AI技術(shù)拓展到了三、四線城市,智慧門店、地產(chǎn)售樓、汽車4S店等場(chǎng)景的應(yīng)用都重在“入鄉(xiāng)隨俗”。此外,中英混雜、多語種等語言習(xí)慣也影響著識(shí)別效果。

02場(chǎng)景驅(qū)動(dòng),定制模型提升識(shí)別率

思必馳推出DUI標(biāo)注訓(xùn)練一體化平臺(tái)是集成語音標(biāo)注、模型自訓(xùn)練、識(shí)別測(cè)試、服務(wù)部署和團(tuán)隊(duì)管理于一體的一站式產(chǎn)品,提供數(shù)據(jù)標(biāo)注-模型優(yōu)化-測(cè)試評(píng)估-服務(wù)部署完整鏈路語音識(shí)別自主優(yōu)化能力,支持私有化部署,協(xié)助企業(yè)在短期內(nèi)實(shí)現(xiàn)識(shí)別效果“不可用->可用”的提升,實(shí)現(xiàn)快速更新響應(yīng),持續(xù)提升場(chǎng)景識(shí)別效果。

思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)全場(chǎng)景應(yīng)用,識(shí)別體驗(yàn)持續(xù)提升!

目前,思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái),已在醫(yī)療、政務(wù)、航空等多個(gè)行業(yè)領(lǐng)域得到應(yīng)用。平臺(tái)支持私有云一鍵化部署,未來也將以公有云的形式對(duì)外開放,用于語音識(shí)別優(yōu)化。注冊(cè)用戶可全流程自主掌握,后續(xù)規(guī)?;耐卣挂矊⒂|類旁通。

思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)全場(chǎng)景應(yīng)用,識(shí)別體驗(yàn)持續(xù)提升!

會(huì)議場(chǎng)景:會(huì)議記錄更細(xì)致

會(huì)議發(fā)言的實(shí)時(shí)轉(zhuǎn)寫、糾錯(cuò)與記錄是現(xiàn)代辦公的強(qiáng)需求。會(huì)議場(chǎng)景下的需求可以歸納為兩方面:

1. 準(zhǔn)確度高,即識(shí)別結(jié)果要準(zhǔn)。行業(yè)領(lǐng)域常用語、專有名詞、中英文混雜、人名職位等各種詞匯篇章表述需要盡可能準(zhǔn)確。借助平臺(tái)進(jìn)行語言和熱詞模型的訓(xùn)練,訓(xùn)練后的模型在會(huì)議真實(shí)場(chǎng)景下的識(shí)別率提升至95%以上。另外,使用語言模型增量訓(xùn)練模式,通過反復(fù)迭代,可以增強(qiáng)在某一個(gè)細(xì)分場(chǎng)景或領(lǐng)域下的識(shí)別效果。除此以外,大會(huì)場(chǎng)景下,可以針對(duì)領(lǐng)導(dǎo)發(fā)言人的用語習(xí)慣進(jìn)行聲學(xué)定制,系統(tǒng)持續(xù)自我“進(jìn)化”,模型將越用越智能。

2. 閱讀性強(qiáng),即識(shí)別出的文本易于閱讀,可懂度高。會(huì)議轉(zhuǎn)寫結(jié)果通常會(huì)是篇章段落,且多含有口語化表達(dá),因此識(shí)別結(jié)果要通俗易懂,尤其在標(biāo)點(diǎn)斷句上要“通人性”。通過平臺(tái)的標(biāo)點(diǎn)、順滑、斷句模型訓(xùn)練可以輸出符合眾人閱讀習(xí)慣的文本。

航空通訊場(chǎng)景:語音質(zhì)檢更安全

航空通訊比通用場(chǎng)景復(fù)雜,除存在諸多QNH(海平面氣壓)類似的縮寫詞匯、專業(yè)術(shù)語外,斷句、發(fā)音方式1(幺)、2(兩)、7(拐)、0(洞)等,也比較特殊。只有精準(zhǔn)識(shí)別座艙內(nèi)飛行員之間、或與地面塔臺(tái)間的溝通話術(shù),才可有效確保飛行安全。用戶通過DUI標(biāo)注訓(xùn)練一體化平臺(tái)可進(jìn)行語言+聲學(xué)+標(biāo)點(diǎn)的自訓(xùn)練,實(shí)現(xiàn)標(biāo)點(diǎn)斷句自動(dòng)化全量質(zhì)檢,降低了人工成本,提升溝通效率,保障飛行安全。在已有落地案例中,實(shí)現(xiàn)了識(shí)別準(zhǔn)確率相對(duì)提升40%。

醫(yī)療場(chǎng)景:專業(yè)術(shù)語更精準(zhǔn)

醫(yī)療場(chǎng)景的應(yīng)用不僅面臨器械噪聲、候診人群說話聲等背景噪聲,還面臨著專業(yè)科室、專家名、病癥等專業(yè)術(shù)語,例如,“血壓150毫米汞柱“、“推 XX Mg液體”。語音識(shí)別的準(zhǔn)確性關(guān)乎診斷結(jié)果的正確輸出。DUI標(biāo)注訓(xùn)練一體化平臺(tái)模型在對(duì)詞匯、語句、發(fā)音優(yōu)化后,實(shí)現(xiàn)識(shí)別準(zhǔn)確率相對(duì)提升40%,在醫(yī)療垂直領(lǐng)域下的效果更佳。平臺(tái)的私有化部署,可將患者隱私存儲(chǔ)在醫(yī)院自建機(jī)房中,確保數(shù)據(jù)安全。

城市交通:風(fēng)暴降噪更清晰

風(fēng)噪、路噪、發(fā)動(dòng)機(jī)噪聲等多重環(huán)境噪音是城市交通場(chǎng)景應(yīng)用的一大難題。DUI標(biāo)注訓(xùn)練一體化平臺(tái)通過思必馳VDCNN自研算法降噪,針對(duì)交通場(chǎng)景深度學(xué)習(xí),在嘈雜環(huán)境下也能耳聽八方。同時(shí),支持普通話/中英混合/英語/粵川滬等多語種及方言的識(shí)別,“入鄉(xiāng)隨俗”準(zhǔn)確識(shí)別“

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )