光大科技自成立來一直積極參與前瞻性研究,并在眾多前沿領域取得豐碩成果。本期讓我們一起來看看光大科技聯(lián)合建信金科在“基于隱私保護計算技術的金融領域數(shù)據(jù)融合應用研究”領域的最新研究成果。
以下文章來源于北京金融科技產(chǎn)業(yè)聯(lián)盟,作者BFIA
【編者按】為推進金融科技安全創(chuàng)新發(fā)展,金融科技產(chǎn)業(yè)聯(lián)盟積極組織會員單位進行前瞻性研究,匯集研究成果及實踐經(jīng)驗,形成《金融科技發(fā)展專報》,供監(jiān)管部門和產(chǎn)業(yè)機構參考。
2020年5月11日,中共中央、國務院印發(fā)《關于新時代加快完善社會主義市場經(jīng)濟體制的意見》,指出推進數(shù)字政府建設,加強數(shù)據(jù)有序共享,依法保護個人信息。數(shù)據(jù)的隱私保護越來越受到重視,隱私保護計算不僅具有重要的理論意義,也具有很強的應用價值,該技術近年來得到了極大的優(yōu)化。本文基于“隱私保護計算金融數(shù)據(jù)領域的融合應用研究”展開闡述,并分析未來金融領域數(shù)據(jù)安全的挑戰(zhàn)與展望。
一、隱私保護計算國內(nèi)外現(xiàn)狀
在現(xiàn)代金融數(shù)字化轉型的趨勢中,“技術+數(shù)據(jù)”的雙輪驅(qū)動效應不斷顯現(xiàn),數(shù)據(jù)能力已經(jīng)成為金融機構的核心競爭力之一。隨著數(shù)據(jù)安全與隱私保護相關法規(guī)政策的不斷趨嚴,金融機構間無法對各方數(shù)據(jù)進行有效融合與利用,產(chǎn)生了日益嚴重的“數(shù)據(jù)孤島”問題,造成了各方的數(shù)據(jù)資源和價值無法充分被發(fā)掘的現(xiàn)狀。為了解決在數(shù)據(jù)安全隱私前提下的數(shù)據(jù)融合與價值發(fā)掘問題,隱私保護計算技術逐漸受到各方的關注,基于信息論、密碼學和可信硬件等理論與技術應用,實現(xiàn)了隱私數(shù)據(jù)的“可用不可見”,有助于在保護各方數(shù)據(jù)隱私,確保業(yè)務在合法合規(guī)的前提下,進行多方數(shù)據(jù)聯(lián)合查詢、聯(lián)合運算、聯(lián)合建模、聯(lián)合預測等業(yè)務探索,賦能金融機構業(yè)務場景,提高營銷和風控等能力。
(一)國內(nèi)現(xiàn)狀
國內(nèi)隱私計算行業(yè)進入高速發(fā)展新階段,金融機構、互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)公司都在加大投入進行技術研發(fā)和應用落地,政府機關和監(jiān)管機構也在積極推進相關法律法規(guī)、技術標準的制定工作,產(chǎn)業(yè)發(fā)展呈現(xiàn)出以下幾方面趨勢。
1.加快培育數(shù)據(jù)要素市場
數(shù)據(jù)作為數(shù)字化的知識和信息,在我國生產(chǎn)領域扮演著越來越重要的角色,引領數(shù)字經(jīng)濟蓬勃發(fā)展的同時,逐漸實現(xiàn)由“中國制造”向“中國創(chuàng)造”發(fā)展路徑的變革目標。而數(shù)據(jù)安全、隱私保護正在成為與之對立的矛盾面。
2020年4月,國務院印發(fā)《關于構建更加完善的要素市場化配置體制機制的意見》,明確把數(shù)據(jù)列為生產(chǎn)要素,并要求“加強數(shù)據(jù)資源整合和安全保護”,“制定數(shù)據(jù)隱私保護制度和安全審查制度”。
2020年12月,四部委發(fā)布《關于加快構建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導意見》,以深化數(shù)據(jù)要素市場化配置改革為核心,優(yōu)化數(shù)據(jù)中心建設布局,推動算力、算法、數(shù)據(jù)、應用資源集約化和服務化創(chuàng)新。
2.出臺信息安全法律法規(guī)
結合大數(shù)據(jù)時代的發(fā)展,國務院在2015年提出了《關于運用大數(shù)據(jù)加強對市場主體服務和監(jiān)管的若干意見》,在數(shù)據(jù)開放的市場下,利用大數(shù)據(jù)以及現(xiàn)代信息技術提升政府對大數(shù)據(jù)的運用能力,完善政府服務和監(jiān)管體系,提高政府數(shù)據(jù)治理水平。其后,國家互聯(lián)網(wǎng)信息辦公室于 2019 年先后發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見稿)》和《個人信息出境安全評估辦法(征求意見稿)》,目前兩項公開征求意見工作均已完成。
在金融領域,國家監(jiān)管部門還發(fā)布了若干關于金融信息安全、金融數(shù)據(jù)治理、消費者數(shù)據(jù)保護的規(guī)定,如:《信息安全技術 金融信息服務安全規(guī)范》、《金融數(shù)據(jù)安全 數(shù)據(jù)安全分級指南》、《個人金融信息保護技術規(guī)范》等。
3.制定金融行業(yè)規(guī)范
人民銀行于2020年11月發(fā)布《多方安全計算金融應用技術規(guī)范》(JR/T 0196—2020),規(guī)定了多方安全計算技術金融應用的基礎要求、安全要求、性能要求等,該標準適用于金融機構開展相關產(chǎn)品設計、軟件開發(fā)、技術應用等。近期,人民銀行組織開展聯(lián)邦學習技術在金融業(yè)務應用標準研究,開展《聯(lián)邦學習技術金融應用規(guī)范》行標編制,擬從技術框架、技術要求、系統(tǒng)安全等方面規(guī)范聯(lián)邦學習在金融領域的應用。截至2021年11月14日,該標準已提交金標委申請立項。
(二)國外現(xiàn)狀
國外數(shù)據(jù)安全和隱私保護法規(guī)較國內(nèi)更為嚴格,相關技術研發(fā)和應用落地進程慢于國內(nèi),各大金融機構使用隱私計算技術的態(tài)度較為謹慎,產(chǎn)業(yè)發(fā)展呈現(xiàn)出以下幾方面趨勢。
1.發(fā)布信息安全法律法規(guī)
國外在法律層面出臺了相關政策以確保公民的隱私安全。歐盟保護公民隱私的《通用數(shù)據(jù)保護條例》(GDPR)于2018年生效,美國《加州消費者隱私保護法案》(CCPA)于2020年生效。
這些法律的公布對用戶隱私保護起到了重要的作用,但同時給智能金融領域帶來前所未有的挑戰(zhàn)。目前,研究界和企業(yè)界的數(shù)據(jù)收集方不一定是數(shù)據(jù)使用方,數(shù)據(jù)在實體間的轉移、交換和交易違反隱私安全保護規(guī)定,并可能遭到法規(guī)的嚴厲懲罰。這些法規(guī)的建立不同程度上對大數(shù)據(jù)、人工智能應用在各個場景中的數(shù)據(jù)處理模式提出新的挑戰(zhàn),不能處理好數(shù)據(jù)服務和用戶隱私保護之間的關系,將極大阻礙信息化的發(fā)展,甚至給社會和個人帶來災難。“隱私安全保護”是智能金融進一步發(fā)展的一個必須要解決的難題。
2.制定行業(yè)標準規(guī)范
電氣和電子工程師協(xié)會(IEEE)標準組于2020年3月發(fā)布了《聯(lián)邦學習系統(tǒng)架構和應用指南》(IEEE 3652.1-2020 - IEEE Guide for Architectural Framework and Application of Federated Machine Learning),該標準對聯(lián)邦學習的定義、概念、分類、算法框架規(guī)范、使用模式和使用規(guī)范等方面都進行了系統(tǒng)性闡述,并對聯(lián)邦學習在To B(企業(yè)端)、To C(用戶端)以及To G(政府端)不同情境下的場景分類,建立了聯(lián)邦學習的需求分析模板,厘定了聯(lián)邦學習性能及安全測評準則。此外IEEE標準組《多方安全計算推薦實踐》(Recommended Practice for Secure Multi-party Computation) , 國際標準化組織ISO《多方安全計算標準》,國際電信聯(lián)盟ITU《多方安全計算技術指南》等均在分別制定當中。
二、隱私保護計算技術與應用概述
結合底層理論與上層應用,將現(xiàn)有的隱私保護計算技術分為三類,分別給出技術和金融應用層面的概述。
(一)多方安全計算技術
多方安全計算技術解決了多方在不暴露原始數(shù)據(jù)的前提下,共同完成某個運算任務,得到一致的運算結果。多方安全計算在上世紀80年代提出,先后出現(xiàn)了混淆電路、秘密分享、同態(tài)加密等技術分支。其中,混淆電路技術利用隨機置換和不經(jīng)意傳輸?shù)让艽a技術,實現(xiàn)各方完成電路運算并獲取結果。秘密分享技術是將各方的隱私數(shù)據(jù)進行隨機化拆分,通過調(diào)用底層加法和乘法等基礎運算模塊,完成多方安全計算的技術框架。同態(tài)加密技術實現(xiàn)了在密文狀態(tài)下對原始信息進行操作和運算,無需擁有解密密鑰就可以完成多方運算任務。當前的多方安全計算技術在精度、安全性、性能等方面能夠達到金融行業(yè)的應用需求,但仍存在算子支持度有限,多方擴展性差,通信量大等問題。
多方安全計算技術能夠在金融應用場景中解決多方聯(lián)合統(tǒng)計、聯(lián)合風控、隱私檢索、用戶隱私篩查、數(shù)據(jù)隱私融合等痛點問題,實現(xiàn)了機構間保護隱私前提下的數(shù)據(jù)協(xié)作。金融機構和監(jiān)管部門已經(jīng)在衍生特征計算、客戶轉化率計算、企業(yè)貸前風險識別、用戶ID隱私匹配與營銷、多機構黑名單隱私融合等金融場景中,對多方安全計算技術進行方案論證和原理驗證。
(二)聯(lián)邦學習技術
聯(lián)邦學習技術是機器學習與隱私計算相結合的新型交叉技術,使用傳統(tǒng)機器學習與半同態(tài)加密技術相結合的技術路線,實現(xiàn)了各方原始數(shù)據(jù)不出本地的模式下進行多方模型訓練與模型預測,能夠獲得比傳統(tǒng)單方訓練更高的模型質(zhì)量。在聯(lián)邦機制下,利用隱私安全計算技術,各參與方的數(shù)據(jù)不發(fā)生轉移,因此不會泄漏用戶隱私或者影響數(shù)據(jù)規(guī)范,是一種在保護數(shù)據(jù)隱私、滿足合法合規(guī)的要求下解決數(shù)據(jù)孤島問題的有效措施。聯(lián)邦學習的應用模式可以分為縱向聯(lián)邦學習、橫向聯(lián)邦學習、聯(lián)邦遷移學習等,技術路線包括同態(tài)加密、秘密分享等。
相比于傳統(tǒng)單方建模,聯(lián)邦學習技術能夠在金融應用場景中提升多方風控模型、多方評分卡模型、客戶營銷模型等模型質(zhì)量,為金融機構帶來更好的風控能力和營銷效果。國內(nèi)多家金融機構都在積極布局和參與聯(lián)邦學習技術的場景落地和示范應用。
(三)可信執(zhí)行環(huán)境技術
可信執(zhí)行環(huán)境技術是可信硬件與密碼學相結合的交叉技術,通過在芯片上劃分可信區(qū)域,并設置嚴格的加密、驗證與準入機制,實現(xiàn)了在可信區(qū)域內(nèi)部完成隱私計算任務,而計算機其他軟硬件均無法自行訪問可信區(qū)域內(nèi)部,保護了源數(shù)據(jù)的安全隱私。可信執(zhí)行環(huán)境技術依賴于芯片廠商(作為可信中心)實時為芯片可信區(qū)域之間的保密通信提供驗證和密鑰簽發(fā)服務。當前主流的可信執(zhí)行環(huán)境技術包括Inter的SGX技術、ARM的Trust Zone技術等。國內(nèi)廠商,例如華為、浪潮等也在積極布局該領域的研發(fā)項目,但是仍不具備國際競爭力。當前,可信執(zhí)行環(huán)境技術的應用,受到國際關系、芯片供給等因素的影響,在國內(nèi)開展應用試點的范圍有限。
三、隱私保護計算在金融數(shù)據(jù)領域的應用實踐
(一)智能風控領域的實踐探索
近年來的技術改進所帶來的智能風控領域突破,切實地影響著我國金融行業(yè)的發(fā)展。
1.為進一步落實國家對于金融服務下沉的要求,建信金科支持中國建設銀行風險部,利用隱私保護計算技術,基于外部消費金融公司電商客群數(shù)據(jù)和建行內(nèi)部客戶相關數(shù)據(jù),在真實業(yè)務和數(shù)據(jù)環(huán)境下,探索建立多方信用風險評價模型,并與單方數(shù)據(jù)模型效果進行比較分析,確認了隱私保護計算技術的可行性。
2.銀行擁有大量有信貸需求的用戶,而數(shù)據(jù)源公司掌握著海量用戶的行為數(shù)據(jù)和場景數(shù)據(jù)。通過隱私安全計算,銀行無需交換明細級原始數(shù)據(jù),即可聯(lián)合其它數(shù)據(jù)源公司建立風控模型。既能打破數(shù)據(jù)壁壘,讓不同公司滿足各自的利益訴求,又能保護各自的數(shù)據(jù)安全和用戶隱私。
以某銀行個人消費貸款申請評分模型為例,該產(chǎn)品的特點是全線上、無抵押,用于滿足客戶裝修、購車、旅游、留學等多方面的用款需求。在風控審批中,該銀行可用的數(shù)據(jù)有客戶在行內(nèi)留存的個人信息以及查詢客戶的信用分數(shù)據(jù),但如果客戶為銀行新戶時,則沒有足夠的行內(nèi)數(shù)據(jù)可以參考,亦或客戶屬于征信白戶,即從未辦理過貸款業(yè)務,也從未申請過信用卡,對于此類客戶,很難對其信用水平進行準確評估。針對這類情況,可以引入外部公司進行聯(lián)合建模,利用運營商通話標簽數(shù)據(jù)為客戶增信,提升模型的預測能力。如圖1所示,在進行聯(lián)合建模前,首先需要找到銀行與外部公司的交集客戶,例如雙方共同的手機號碼,通過PSI技術保證雙方均無法知道合作方的差集客戶。
圖1 聯(lián)合建模樣本對齊
建模時,銀行擁有標簽數(shù)據(jù)和征信分數(shù)據(jù),運營商擁有通話標簽數(shù)據(jù),模型訓練完成時,雙方僅可獲得各自對應變量的系數(shù),模型效果相較僅使用自有信用分數(shù)據(jù)有了顯著提高,結果表明,基于聯(lián)合建模的AUC提高了約10%。利用聯(lián)合建模,不僅解決了征信數(shù)據(jù)來源單一的問題,提高了模型效果,同時也更好地保護了客戶隱私,進而幫助銀行滿足合規(guī)要求,實現(xiàn)智能風控升級。
(二)智能營銷領域的實踐探索
智能營銷通過為消費者提供個性化與精準化的服務,解決了金融機構產(chǎn)品與客戶間互聯(lián)互通的障礙。
為實現(xiàn)集團一體化的戰(zhàn)略目標,建信金科支持中國建設銀行上海大數(shù)據(jù)智慧中心,利用隱私保護計算技術聯(lián)合子公司建信基金,在“速盈客戶價值提升”的場景中實現(xiàn)建行-建信基金的“母子聯(lián)邦”業(yè)務形式,實現(xiàn)跨雙方的聯(lián)合模型構建,定位目標客群,助力客戶價值提升。
(三)基于VSS的金控集團跨機構數(shù)據(jù)統(tǒng)計
大型金融控股集團中,各金融企業(yè)的用戶信息常常比較分散。對不同企業(yè)間用戶信息進行統(tǒng)計,有助于挖掘更多數(shù)據(jù)價值。對于跨機構數(shù)據(jù)統(tǒng)計問題,傳統(tǒng)方案中,金控集團通常建立大型數(shù)據(jù)中心,各金融企業(yè)將數(shù)據(jù)上傳至數(shù)據(jù)中心,數(shù)據(jù)中心進行統(tǒng)計。但社會對用戶隱私問題的重視程度逐漸提升,以及各級立法和監(jiān)管機構出臺多項法律法規(guī)和監(jiān)管規(guī)定,加強對個人金融數(shù)據(jù)隱私的保護力度,傳統(tǒng)的統(tǒng)計方法已無法滿足對個人金融數(shù)據(jù)隱私保護的監(jiān)管要求。在光大集團的聯(lián)邦數(shù)據(jù)治理實踐過程中,針對跨機構用戶資產(chǎn)求和這一場景,實現(xiàn)基于可驗證秘密共享(verifiable secret sharing)的安全多方隱私求和方案,在數(shù)據(jù)不出本地的情況下,對用戶在多個機構的數(shù)據(jù)求和。該方案在保障光大用戶信息絕對安全的前提下,實現(xiàn)了數(shù)據(jù)的協(xié)同計算,最大化地釋放了數(shù)據(jù)要素的價值。
(四)行業(yè)的生態(tài)建設
為推動數(shù)據(jù)安全與隱私保護工作,進一步了解隱私計算技術在金融領域應用實踐的難點和痛點,北京金融科技產(chǎn)業(yè)聯(lián)盟發(fā)起隱私技術金融應用調(diào)研并形成了《隱私計算金融應用調(diào)研報告》,為行業(yè)相關機構開展和推進隱私保護及數(shù)據(jù)共享等工作提供參考。
在業(yè)務應用創(chuàng)新之外,行業(yè)的生態(tài)建設同樣推進著隱私保護計算在金融行業(yè)的迭代發(fā)展?;诋斍坝绊懽畲蟮碾[私計算開源社區(qū)FATE,在落地應用探索中,多家金融機構逐步認識到開源聯(lián)邦學習FATE框架不能完全滿足實際業(yè)務需求。經(jīng)過各家金融機構的前期交流,FATE社區(qū)于2020年12月技術支持委員會內(nèi)部會議上,發(fā)表了FATE金融分支的創(chuàng)立聲明,由多家金融機構共同成立獨立工作組,將投入資源繼續(xù)研發(fā)針對金融行業(yè)相關場景的安全、高效隱私計算算法和框架,并不斷持續(xù)優(yōu)化迭代,該做法得到了技術支持委員會全體成員的一致認可。
四、金融領域數(shù)據(jù)安全的挑戰(zhàn)與展望
(一)當前主要挑戰(zhàn)
隱私保護計算技術路線多樣,不同技術的底層安全機制區(qū)別較大,相關協(xié)議的系統(tǒng)性安全性評估和論證仍未完全成熟,相關國家標準密碼算法缺失,相關解決方案在金融場景落地中的安全性和穩(wěn)定性仍需更多實際業(yè)務和應用的驗證和支撐。當前的隱私計算技術在抗惡意攻擊、抗合謀攻擊、抗量子攻擊、依賴可信第三方、計算精度、通信量、算子豐富度等方面仍存在較多問題,需要學術界和產(chǎn)業(yè)界共同積極解決。
隨著《個人信息保護法》和《數(shù)據(jù)安全法》等法律法規(guī)制定工作的不斷深入,對于數(shù)據(jù)確權、數(shù)據(jù)出域、隱私數(shù)據(jù)流通與交易、用戶授權等概念和評判標準仍有一定的爭議。嚴格的數(shù)據(jù)安全管控與隱私計算產(chǎn)業(yè)發(fā)展之間仍存在一定的矛盾性,各個金融機構對于本單位數(shù)據(jù)保護要求不盡相同(例如是否接受哈希值出域、是否接受交集用戶名單出域、是否接受密文出域等),為跨機構數(shù)據(jù)融合應用場景落地造成了一定的困難。需要立法機關、金融監(jiān)管機構等單位推動相關的數(shù)據(jù)分級與應用落地樣板,讓金融機構在數(shù)據(jù)融合應用中有章可循。
(二)總結與展望
隱私計算技術越來越受到金融機構和監(jiān)管部門的重視,也得到了學術界和產(chǎn)業(yè)界的積極響應,相關理論和技術研發(fā)創(chuàng)新也進入了快速發(fā)展和完善的進程中,有能力為金融機構和監(jiān)管部門在風險防控、智能營銷、數(shù)據(jù)融合、聯(lián)合統(tǒng)計等場景提供不斷更新迭代的解決方案。隨著相關政策法規(guī)的不斷完善,隱私計算金融場景落地不斷深化,金融數(shù)據(jù)綜合應用試點等項目進一步取得成效,隱私計算技術能夠在合法合規(guī)的前提下實現(xiàn)各參與方數(shù)據(jù)融合與協(xié)作的多贏局面,進而促進激活數(shù)據(jù)要素潛能,加快金融業(yè)數(shù)字化轉型,賦能金融服務提質(zhì)增效,推動構建金融機構數(shù)據(jù)融合應用生態(tài)系統(tǒng)。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )