如今,多模態(tài)、預訓練排序等新興技術在金融領域的深入應用,為行業(yè)發(fā)展注入了新動能。度小滿深知前沿科技對推動金融行業(yè)創(chuàng)新變革的重要性,一直深耕技術創(chuàng)新,在多個前沿技術領域都獲得了深厚的技術積累。最近,度小滿金融數(shù)據(jù)智能應用部AI-Lab的兩篇論文分別入選了ACM MM和CIKM國際頂級會議。
據(jù)了解,度小滿的兩篇論文分別就多模態(tài)和預訓練排序等多個熱門話題提出了新穎的算法,并在相關任務上達到了國際頂尖水平,獲得了審稿人的一致好評并最終錄用。這標志著度小滿在自然語言處理和計算機視覺等人工智能前沿領域的研究得到了國際同行的認可。
新模型可有效提升度小滿在視覺風控方面的技術能力
兩篇論文中,度小滿論述“具有實體對齊網(wǎng)格的位置增強Transformer”的論文被ACM MM錄用。ACM MM(ACM International Conference on Multimedia)是計算機科學領域中多媒體領域的頂級國際會議,涵蓋了多個媒體領域的前沿研究與進展,包括圖像,文字,音頻,傳感器等,被中國計算機學會(CCF)列為A類會議。
許多圖像除了實際的物體和背景等信息外,通常還包含著很有價值的文本信息,這對于理解圖像場景是十分重要的。因此該論文主要研究基于文本的視覺問答任務,這項任務要求機器可以理解圖像場景并閱讀圖像中的文本來回答相應的問題。然而之前的大多數(shù)工作往往需要設計復雜的圖結構和利用人工指定的特征來構建圖像中視覺實體和文本之間的位置關系。為了直觀有效地解決這些問題,度小滿科研人員提出了具有實體對齊網(wǎng)格的位置增強Transformer。
該模型能夠整合目標檢測、OCR以及基于Transformer的文本表示等多種方法的優(yōu)勢,增強算法對于圖像中場景信息的理解,更精準的融合圖像與文本多模態(tài)的信息,進一步助力證件識別、人臉與活體檢測等業(yè)務場景,提升度小滿在視覺風控方面的技術能力。
度小滿對預訓練排序深入研究為金融數(shù)據(jù)管理提供依據(jù)
度小滿另一篇闡述“基于BERT的動態(tài)多粒度排序模型”的論文被CIKM錄用。CIKM(The Conference on Information and Knowledge Management )是由ACM主辦的信息檢索和數(shù)據(jù)挖掘等領域的國際頂級會議,由國際計算機學會ACM SIGIR分會主辦,每年召開一次。
近年來,預訓練的語言模型廣泛應用于文本的檢索排序任務中。然而,在真實場景中,用戶的行為往往受到選擇或曝光偏差的影響,這可能會導致錯誤的標簽進而引入額外噪聲。而對于不同候選文檔,以往的訓練優(yōu)化目標通常使用單一粒度和靜態(tài)權重。這使得排序模型的性能更容易受到上述問題的影響。
因此,在該論文中,度小滿科研人員重點研究了基于BERT的文檔重排序任務,開創(chuàng)性地提出了動態(tài)多粒度學習方法。該種方法能夠讓不同文檔的權重根據(jù)預測概率動態(tài)變化,從而減弱不正確的文檔標簽帶來的負面影響。此外,該方法還同時考慮了文檔粒度和實例粒度來平衡候選文檔的相對關系和絕對分數(shù)。在相關基準數(shù)據(jù)集上的實驗進一步驗證了度小滿模型的有效性。
度小滿兩篇論文入選國際頂級會議,再次展現(xiàn)了度小滿雄厚的技術實力。多年來,度小滿始終致力于以先進科技破解金融服務難題,推動科技與金融的深度融合發(fā)展。在度小滿等金融科技企業(yè)的共同努力下,未來日益成熟的金融科技,相信也將推動金融行業(yè)邁向全新發(fā)展階段。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )