目前,隨著AI技術(shù)在金融領(lǐng)域的廣泛應(yīng)用,加快對多模態(tài)和預(yù)訓(xùn)練排序等創(chuàng)新技術(shù)的研究,將為金融行業(yè)數(shù)字化轉(zhuǎn)型升級提供重要的技術(shù)支撐。度小滿近年來在前沿技術(shù)領(lǐng)域積極布局,并不斷取得新突破、新成果,為推動金融行業(yè)發(fā)展持續(xù)貢獻科技力量。日前,度小滿的兩篇論文還分別入選了兩大國際頂級會議。
據(jù)了解,度小滿金融數(shù)據(jù)智能應(yīng)用部AI-Lab的兩篇論文分別入選ACM MM和CIKM國際頂級會議。兩篇論文分別就多模態(tài)和預(yù)訓(xùn)練排序等多個熱門話題提出了新穎的算法,并在相關(guān)任務(wù)上達到了國際頂尖水平,獲得了審稿人的一致好評并最終錄用。這標(biāo)志著度小滿在自然語言處理和計算機視覺等人工智能前沿領(lǐng)域的研究得到了國際同行的認可。
新模型可有效提升度小滿視覺風(fēng)控方面的技術(shù)能力
其中,度小滿具有實體對齊網(wǎng)格的位置增強Transformer的論文被ACM MM錄用,以下為該論文簡介:
許多圖像除了實際的物體和背景等信息外,通常還包含著很有價值的文本信息,這對于理解圖像場景是十分重要的。因此本文主要研究基于文本的視覺問答任務(wù),這項任務(wù)要求機器可以理解圖像場景并閱讀圖像中的文本來回答相應(yīng)的問題。然而之前的大多數(shù)工作往往需要設(shè)計復(fù)雜的圖結(jié)構(gòu)和利用人工指定的特征來構(gòu)建圖像中視覺實體和文本之間的位置關(guān)系。
為了直觀有效地解決這些問題,我們提出了具有實體對齊網(wǎng)格的位置增強Transformer。與之前的模型相比,我們在不需要復(fù)雜規(guī)則的情況下,顯式地引入了目標(biāo)檢測和OCR識別的視覺實體的連續(xù)相對位置信息。同時我們根據(jù)物體與OCR實體映射關(guān)系,用直觀的實體對齊網(wǎng)格代替復(fù)雜的圖形結(jié)構(gòu)。在該網(wǎng)格中,不同位置的離散實體和圖像的區(qū)塊信息可以充分交互。
該模型能夠整合目標(biāo)檢測、OCR以及基于Transformer的文本表示等多種方法的優(yōu)勢,增強算法對于圖像中場景信息的理解,更精準的融合圖像與文本多模態(tài)的信息,進一步助力證件識別、人臉與活體檢測等業(yè)務(wù)場景,提升度小滿在視覺風(fēng)控方面的技術(shù)能力。
度小滿開創(chuàng)性提出動態(tài)多粒度學(xué)習(xí)方法
度小滿另一篇基于BERT的動態(tài)多粒度排序模型的論文被CIKM錄用,以下為該論文簡介:
近年來,預(yù)訓(xùn)練的語言模型廣泛應(yīng)用于文本的檢索排序任務(wù)中。然而,在真實場景中,用戶的行為往往受到選擇或曝光偏差的影響,這可能會導(dǎo)致錯誤的標(biāo)簽進而引入額外噪聲。而對于不同候選文檔,以往的訓(xùn)練優(yōu)化目標(biāo)通常使用單一粒度和靜態(tài)權(quán)重。這使得排序模型的性能更容易受到上述問題的影響。
因此,在本文中我們重點研究了基于BERT的文檔重排序任務(wù),開創(chuàng)性地提出了動態(tài)多粒度學(xué)習(xí)方法。該種方法能夠讓不同文檔的權(quán)重根據(jù)預(yù)測概率動態(tài)變化,從而減弱不正確的文檔標(biāo)簽帶來的負面影響。此外,該方法還同時考慮了文檔粒度和實例粒度來平衡候選文檔的相對關(guān)系和絕對分數(shù)。在相關(guān)基準數(shù)據(jù)集上的實驗進一步驗證了我們模型的有效性。
在前沿技術(shù)領(lǐng)域,度小滿持續(xù)加強探索研究,并將創(chuàng)新技術(shù)成果運用于金融各大領(lǐng)域,為推動金融行業(yè)創(chuàng)新發(fā)展持續(xù)貢獻科技力量。未來,度小滿將繼續(xù)聚焦前沿技術(shù)創(chuàng)新,推動科技在金融場景的創(chuàng)新應(yīng)用,助力金融行業(yè)高質(zhì)量發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )