信也科技受邀參加國(guó)際AI頂會(huì)IJCAI 2022 共享DGraph大規(guī)模動(dòng)態(tài)圖數(shù)據(jù)集

近日,人工智能領(lǐng)域頂級(jí)國(guó)際學(xué)術(shù)會(huì)議IJCAI 2022在奧地利維也納成功召開(kāi)。信也科技受邀參會(huì),并通過(guò)線上參與的方式發(fā)表了題為《DGraph:A Large-Scale Financial Benchmark for Graph Anomaly Detection》的演講,分享了信也科技聯(lián)合浙江大學(xué)發(fā)布的大規(guī)模動(dòng)態(tài)圖數(shù)據(jù)集DGraph,以助力推動(dòng)整個(gè)圖領(lǐng)域的發(fā)展,為人工智能創(chuàng)新發(fā)展貢獻(xiàn)自己的一份力量。

信也科技首席科學(xué)家王春平指出,當(dāng)前圖領(lǐng)域正在經(jīng)歷算法繁榮期,新算法的提出相當(dāng)活躍,實(shí)際落地場(chǎng)景與公開(kāi)用于學(xué)術(shù)領(lǐng)域的數(shù)據(jù)集逐漸豐富。然而,現(xiàn)實(shí)場(chǎng)景的復(fù)雜度遠(yuǎn)超現(xiàn)有公開(kāi)數(shù)據(jù)的復(fù)雜度,尤其是圖的異常檢測(cè)(GraphAnomalyDetection,GAD)領(lǐng)域,極度缺乏大規(guī)模、異常比例較低的數(shù)據(jù)集。

信也科技首席科學(xué)家王春平分享

本次面向?qū)W術(shù)研究領(lǐng)域公開(kāi)的數(shù)據(jù)集DGraph,來(lái)自于真實(shí)的金融業(yè)務(wù)場(chǎng)景,節(jié)點(diǎn)數(shù)超過(guò)370萬(wàn),是此前常用的GAD領(lǐng)域大規(guī)模數(shù)據(jù)集Elliptic的17倍;它的異常節(jié)點(diǎn)比例低于2%,遠(yuǎn)低于主流GAD數(shù)據(jù)集。很重要的是,DGraph保留了邊的時(shí)間信息,從而反映了整個(gè)圖結(jié)構(gòu)隨著時(shí)間的變化,填補(bǔ)了帶有節(jié)點(diǎn)特征、邊特征的動(dòng)態(tài)圖空白。此外,DGraph還保留了真實(shí)場(chǎng)景中數(shù)據(jù)的復(fù)雜性。比如,它包含超過(guò)200萬(wàn)不作為預(yù)測(cè)目標(biāo)但與目標(biāo)節(jié)點(diǎn)可能有千絲萬(wàn)縷聯(lián)系的背景節(jié)點(diǎn);它的節(jié)點(diǎn)特征帶有大量的缺失值。這些特點(diǎn)可以幫助對(duì)算法進(jìn)行真刀真槍的打磨。

大規(guī)模動(dòng)態(tài)圖數(shù)據(jù)集DGraph

此前IJCAI 2022公開(kāi)數(shù)據(jù)顯示,此次大會(huì)共收到來(lái)自全球的4535篇論文投稿,最終接收率僅為15%。信也科技與浙江大學(xué)聯(lián)合提交的論文《Beyond Homophily:Structure-aware Path Aggregation Graph Neural Network》成功入選,應(yīng)邀參加此次大會(huì)分享。該論文突破了經(jīng)典圖神經(jīng)網(wǎng)絡(luò)的同質(zhì)性約束,拓展提升了圖神經(jīng)網(wǎng)絡(luò)的表達(dá)能力,對(duì)于反欺詐、反洗錢(qián)、AI芯片設(shè)計(jì)等具有異質(zhì)傾向的圖數(shù)據(jù)領(lǐng)域都具有潛在的應(yīng)用價(jià)值。

一直以來(lái),信也科技始終保持對(duì)科技研發(fā)的關(guān)注與投入,不僅在業(yè)務(wù)應(yīng)用落地方面,在人工智能學(xué)術(shù)產(chǎn)出方面也是碩果累累。僅在圖算法領(lǐng)域,信也科技聯(lián)合浙江大學(xué)、UCLA等高校先后在CKIM、TKDE、AAAI等人工智能頂級(jí)學(xué)術(shù)會(huì)議、期刊發(fā)表了多篇論文,聚焦的內(nèi)容從圖的GAD場(chǎng)景有效應(yīng)用,到圖的魯棒性和攻擊對(duì)抗、預(yù)訓(xùn)練和泛化性等更為基礎(chǔ)的問(wèn)題,得到了國(guó)際同行越來(lái)越多的認(rèn)可。

此次發(fā)布公開(kāi)數(shù)據(jù)集DGraph,濃縮了信也科技在圖領(lǐng)域的觀察和嘗試,旨在提供更為有挑戰(zhàn)的動(dòng)態(tài)GAD數(shù)據(jù),激發(fā)更多有價(jià)值問(wèn)題的提出,推動(dòng)整個(gè)圖算法領(lǐng)域的發(fā)展。這標(biāo)志著信也科技在人工智能領(lǐng)域的研究進(jìn)程中取得了重要的階段性成果,也展示出信也科技持續(xù)對(duì)科技進(jìn)行投入的誠(chéng)意和信心。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )