近日,第二十六屆ICONIP國際神經(jīng)信息處理學(xué)術(shù)會議(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亞悉尼召開,平安科技自動化機器學(xué)習(xí)平臺(AutoML)----奧卡姆Occam平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大會上進行主題演講。這是繼在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競賽獲得冠軍、獲得2019年CCF科學(xué)技術(shù)獎科技進步杰出獎后,平安科技奧卡姆平臺的又一項重大突破。
ICONIP會議是由亞太神經(jīng)網(wǎng)絡(luò)協(xié)會APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經(jīng)網(wǎng)絡(luò)領(lǐng)域最重要的會議之一。本次會議特別邀請到了神經(jīng)網(wǎng)絡(luò)領(lǐng)域權(quán)威專家David Powers 和 Bao-Liang Lu等嘉賓出席并進行主題分享,并匯聚了來自世界各地從事人工智能理論和應(yīng)用研究的頂尖研究人員,共同分享國際人工智能研究領(lǐng)域的最新理論和技術(shù)成果。會議共收到1200+篇來自世界頂尖學(xué)府和科研機構(gòu)的論文投稿,最終錄用337篇,會議錄用率僅為27.4%,而受到邀請進行主題演講的文章更是屈指可數(shù)。
圖1 第26屆ICONIP
平安科技奧卡姆平臺研究成果發(fā)布
平安科技奧卡姆平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團首席科學(xué)家肖京博士指導(dǎo),平安科技副總工程師王健宗博士作為論文的通訊作者,在會議錄用的337篇論文中脫穎而出,并受邀成為口頭報告論文。
奧卡姆平臺這篇論文針對OCR識別中未分段文本識別模型中的校準(zhǔn)異常問題,創(chuàng)新性地將順序文字識別網(wǎng)絡(luò)(SRN)與校準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)(Calibration CNN)相結(jié)合,提出了一種將未分段文本轉(zhuǎn)化為單個字符并進行識別校準(zhǔn)的新型算法。不同于傳統(tǒng)算法針對一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個文字提取出來,雖然仍采用相同的識別模型,但是憑借奧卡姆平臺計算能力極強的優(yōu)勢,可以并對不同的個體文字自適應(yīng)地選擇不同的校正參數(shù),調(diào)整每個文字識別結(jié)果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實應(yīng)用中,通過使用奧卡姆平臺,高效、快速地在三個樣本集中試驗了五種不同的CNN參數(shù)校準(zhǔn)方式,并得出了以DenseNet結(jié)構(gòu)的為基礎(chǔ)的最佳識別校準(zhǔn)算法。
圖2 奧卡姆論文提出的校準(zhǔn)方式
本論文的研究成果可利用在金融、保險、醫(yī)療等領(lǐng)域?qū)ㄗC、財務(wù)票據(jù)等信息進行智能識別錄入。以智能投保場景為例,用戶可利用論文中的技術(shù),對駕駛證、行駛證等證件上的未分段信息進行識別,實現(xiàn)車主信息的自動識別和錄入。在手機移動投保、信息核實等過程中有效提升運營效率,優(yōu)化用戶體驗。
定義全新的AI開發(fā)模式,Occam平臺屢獲殊榮Occam平臺是平安集團研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開發(fā)平臺,為用戶提供了從數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標(biāo)注、數(shù)據(jù)增強、多元模型自動搜索、超參優(yōu)化、模型自動壓縮、圖神經(jīng)網(wǎng)絡(luò)、聯(lián)邦學(xué)習(xí)、難例自動發(fā)現(xiàn)等多種特色工具和服務(wù)。
圖3 奧卡姆平臺概覽
2019年,Occam平臺的多項優(yōu)秀成果得到國內(nèi)計算機領(lǐng)域權(quán)威學(xué)術(shù)團體的肯定。不僅首次榮獲"2019年CCF科學(xué)技術(shù)獎科技進步杰出獎",還在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競賽中,力壓由康奈爾大學(xué)和谷歌組成的豪華聯(lián)隊,以7.579毫秒的驚人成績勇奪冠軍。
當(dāng)前Occam平臺已落地平安產(chǎn)險,并為平安聲紋、AI音樂、智能視覺等多個AI團隊項目提供平臺支持。例如:Occam平臺實現(xiàn)了首個基于神經(jīng)架構(gòu)搜索的聲紋識別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個高精度聲紋識別模型,其效果遠超過如Xvector、LSTM-GE2E等最先進的頂級專家設(shè)計的聲紋模型,并且聲紋模型訓(xùn)練最高可達到90%的訓(xùn)練提速。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 科技晚報:劉強東豪捐小學(xué)老師紅包,RTX 5090顯卡震撼登場
- 京東PLUS會員新福利:生活服務(wù)包、180天只換不修、自營免郵秒送,購物更省心!
- 英特爾新處理器酷睿Ultra 200HX系列:性能與功耗的完美平衡,帶來全新體驗
- 傳音控股攜手阿里云打造AI新勢力:通義千問大模型賦能傳音AI手機,創(chuàng)新科技引領(lǐng)未來
- 云從科技回應(yīng)被美列入黑名單:否認指控并表示業(yè)務(wù)不受影響,獨立自主是關(guān)鍵
- RTX 5090顯卡震撼來襲:一卡兩倍強,價格也翻倍!國行售價起價16499元
- 戴爾重塑PC品牌:別出心裁的命名慣例,是否引領(lǐng)新潮流?
- 劉強東回饋家鄉(xiāng),教師每人獲萬元紅包,年貨滿滿暖人心
- AI Agent引爆新風(fēng)口:數(shù)萬億市場待挖掘,未來已來!
- OpenAI奧特曼談AI定價:揭秘AGI門檻,理性剖析AI新時代
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。