近日,由人工智能領(lǐng)域的主要學(xué)術(shù)組織之一Association for the Advance of Artificial Intelligence(國(guó)際人工智能促進(jìn)協(xié)會(huì))主辦的年會(huì),也是人工智能國(guó)際頂級(jí)學(xué)術(shù)會(huì)議之一AAAI 2022以線上虛擬會(huì)議的形式召開。信也科技(NYSE:FINV)算法智能團(tuán)隊(duì)與浙江大學(xué)楊洋副教授團(tuán)隊(duì)、美國(guó)加州大學(xué)洛杉磯分校(UCLA)孫怡舟教授團(tuán)隊(duì)合作的兩篇論文均被該會(huì)議收錄。
AAAI是人工智能領(lǐng)域中歷史最悠久、涵蓋內(nèi)容最廣泛的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議之一,也是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的人工智能領(lǐng)域A級(jí)國(guó)際學(xué)術(shù)會(huì)議之一。據(jù)了解,本屆會(huì)議收到來自全球的 9215 篇投稿論文,而接受率僅為 15%,創(chuàng)歷史新低。信也科技大數(shù)據(jù)團(tuán)隊(duì)與國(guó)內(nèi)外知名教授合作的兩篇論文被該會(huì)議成功收錄,標(biāo)志著信也科技在人工智能領(lǐng)域的研究進(jìn)程中取得了重要的階段性成果。
隨著人工智能算法日益廣泛的應(yīng)用,算法的魯棒性和安全性,受到越來越多的關(guān)注,這也是AAAI2022的熱點(diǎn)議題之一。信也科技本次發(fā)表的兩篇論文正是圍繞圖數(shù)據(jù)的對(duì)抗攻擊,兩篇論文分別研究圖對(duì)抗攻擊中的“矛”與“盾”:在攻擊層面,研究表明,即使在攻擊者僅知道目標(biāo)模型是一個(gè)圖模型,而沒有任何其他模型信息且無法與模型做任何互動(dòng)的情況下,依然有可能展開有效的攻擊;在防御層面,研究面向圖模型預(yù)訓(xùn)練框架的無監(jiān)督魯棒表示學(xué)習(xí)算法,通過一套防御策略便能有效阻斷攻擊者對(duì)各個(gè)不同下游任務(wù)造成的影響。
此次會(huì)議中,信也科技在名為《Blindfolded Attackers Still Threatening: Strict Black-Box Adversarial Attacks on Graphs》的論文中展示了其在針對(duì)圖模型的嚴(yán)格黑盒對(duì)抗攻擊中得到的成果,打碎了原有的幻像:只要完美地保護(hù)好模型就能攔截住所有類型的攻擊。事實(shí)上哪怕攻擊者對(duì)模型一無所知,也是有可能發(fā)起有效攻擊的。
據(jù)論文研究,根據(jù)攻擊者所能掌握的關(guān)于圖模型的知識(shí)量,可以把攻擊分為五類(如表1)。其中,本文提出了一種更接近實(shí)際情況的攻擊方式——嚴(yán)格黑盒圖攻擊(STACK),也就是攻擊者對(duì)被攻擊的模型一無所知,也無法通過查詢模型來獲取更多信息。相比于人臉識(shí)別等強(qiáng)互動(dòng)的場(chǎng)景,這種情況在規(guī)則復(fù)雜的金融場(chǎng)景尤其常見。這也是本文的第一個(gè)重要貢獻(xiàn)。
表1:不同的圖對(duì)抗攻擊,按照攻擊者是否掌握模型的全部 (√ ), 有限 (?), 或者沒有 (×)信息來分類
STACK攻擊策略能在更接近真實(shí)場(chǎng)景的情況下去模擬和預(yù)估受攻擊的危害,但同時(shí)也帶來很大的挑戰(zhàn)。首先,絕大部分已有的圖攻擊策略都是為特定模型設(shè)計(jì)的,無法拓展到嚴(yán)格黑盒攻擊的設(shè)定下。因此,第一個(gè)挑戰(zhàn)是需要為各種各樣的圖模型找到一個(gè)共同的基石。其次,現(xiàn)有的方法總是需要用模型的預(yù)測(cè)結(jié)果或者替代模型的反饋去衡量攻擊的影響。因此,第二個(gè)挑戰(zhàn)是需要在沒有來自被攻擊模型的任何反饋的情況下,有效的定量并且高效的計(jì)算圖攻擊的強(qiáng)度。
圖1:針對(duì)圖模型的嚴(yán)格黑盒對(duì)抗攻擊概況
本文的第二個(gè)貢獻(xiàn)是,針對(duì)這兩方面挑戰(zhàn),提出了一個(gè)通用的圖濾波器,適用于各種圖模型,并且推導(dǎo)出了一個(gè)高效的攻擊策略來選擇對(duì)抗的圖數(shù)據(jù)邊(如圖1)。在此基礎(chǔ)上,本文的第三個(gè)貢獻(xiàn)是,通過大量實(shí)驗(yàn)驗(yàn)證:即使當(dāng)攻擊者對(duì)被攻擊模型一無所知時(shí),在節(jié)點(diǎn)分類和圖分類這兩類圖數(shù)據(jù)最重要的應(yīng)用場(chǎng)景上,模型效果都會(huì)因?yàn)楣舳蠓陆怠?/p>
由信也科技發(fā)表的另外一篇題為《Unsupervised Adversarially Robust Representation Learning on Graphs》中,更將研究視角轉(zhuǎn)向了面向圖數(shù)據(jù)的無監(jiān)督對(duì)抗魯棒表示學(xué)習(xí)。
無監(jiān)督/自監(jiān)督的圖預(yù)訓(xùn)練模型近幾年受到了眾多關(guān)注,并且可以推廣到各種不同的下游應(yīng)用中。然而,圖預(yù)訓(xùn)練模型的對(duì)抗魯棒性仍未被充分探索。該論文中提出,在無監(jiān)督的圖預(yù)訓(xùn)練框架中(如圖2),使用魯棒的圖編碼器就能夠有效防止對(duì)抗風(fēng)險(xiǎn)傳播到下游任務(wù)中,并且圖編碼器學(xué)習(xí)得到的魯棒圖表征可以適用于不同的下游應(yīng)用中,比如節(jié)點(diǎn)分類、鏈接預(yù)測(cè)和社區(qū)識(shí)別等。
圖2:對(duì)抗攻擊下的圖預(yù)訓(xùn)練概覽。如果圖編碼器易受攻擊,對(duì)抗風(fēng)險(xiǎn)會(huì)通過受到擾動(dòng)的圖表征轉(zhuǎn)導(dǎo)到每個(gè)下游任務(wù)。
研究無監(jiān)督圖預(yù)訓(xùn)練模型的魯棒性時(shí),模型的魯棒性通常定義在標(biāo)簽空間上,即現(xiàn)有網(wǎng)絡(luò)魯棒性度量需要依據(jù)樣本的預(yù)測(cè)結(jié)果或標(biāo)簽進(jìn)行計(jì)算,并不適用于本文的無監(jiān)督設(shè)置。而在無監(jiān)督圖表征模型中,如何在表征空間上定義魯棒性度量是第一個(gè)挑戰(zhàn)。
為了應(yīng)對(duì)上述挑戰(zhàn),本文首先提出了一個(gè)基于信息論的圖編碼器魯棒性衡量指標(biāo):圖表征脆弱性(graph representation vulnerability, GRV)。?其次,文章將魯棒性學(xué)習(xí)問題形式化為一個(gè)優(yōu)化問題,保證了圖編碼器的強(qiáng)表征能力和高魯棒性。?但是,如何有效地計(jì)算或逼近該優(yōu)化問題的目標(biāo)函數(shù)是第二個(gè)挑戰(zhàn)。該挑戰(zhàn)的難點(diǎn)在于:?一方面,優(yōu)化問題的目標(biāo)函數(shù)非常難解;另一方面,如何在聯(lián)合輸入空間(由網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)特征組成)中描述攻擊能力并確定擾動(dòng)邊界也同樣棘手。
為了解決以上問題,文章采用概率分布之間的Wasserstein 距離來量化攻擊能力,并提供了一個(gè)搜索攻擊策略的高效近似方案。其次,文章采用投影梯度下降法(projected gradient descent, PGD)的變種來解決所提出的優(yōu)化問題。最終,本文在對(duì)抗環(huán)境中能夠?qū)W得一個(gè)高質(zhì)量的魯棒圖編碼器,并進(jìn)一步探索了GRV和下游任務(wù)分類器的魯棒性之間的理論聯(lián)系。
本次AAAI收錄的兩篇論文正是信也科技與浙江大學(xué)和UCLA在圖算法的魯棒性和安全性領(lǐng)域的合作研究的新成果。信也科技-浙江大學(xué)聯(lián)合人工智能研發(fā)中心在過去幾年已經(jīng)陸續(xù)在將圖數(shù)據(jù)和圖認(rèn)知算法與風(fēng)控反欺詐業(yè)務(wù)結(jié)合,圖的預(yù)訓(xùn)練算法,圖的結(jié)構(gòu)學(xué)習(xí),以及圖算法的魯棒性提升等領(lǐng)域做出了多項(xiàng)成果。
據(jù)悉,兩篇論文在組委會(huì)國(guó)內(nèi)外知名學(xué)者專家的匿名評(píng)審后獲得高度認(rèn)可,這也標(biāo)志著信也科技在人工智能學(xué)術(shù)研究領(lǐng)域的重大飛躍。
信也科技在學(xué)術(shù)界備受認(rèn)可,且在技術(shù)落地方面經(jīng)驗(yàn)豐富,據(jù)悉其已實(shí)現(xiàn)了對(duì)信貸業(yè)務(wù)流程的全覆蓋,如人臉識(shí)別、多場(chǎng)景OCR、聲紋識(shí)別等多模態(tài)核身、增信技術(shù),語音識(shí)別、意圖識(shí)別、對(duì)話管理、語音生成等全流程智能對(duì)話機(jī)器人技術(shù),以及基于復(fù)雜網(wǎng)絡(luò)的不良中介識(shí)別和團(tuán)伙識(shí)別技術(shù)等。
信也科技取得成績(jī)的背后是長(zhǎng)久以來著眼于科技并致力于科研的信念,未來的信也科技將繼續(xù)保持對(duì)科技研發(fā)的關(guān)注與投入,不斷突破并創(chuàng)新,努力實(shí)現(xiàn)“科技,讓金融更美好”的使命。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )