IBM為神經(jīng)網(wǎng)絡模型添加水印,防止珍貴研究成果被盜

高層速讀

關(guān)鍵信息:任何有價值的東西都有被偷的可能性,IBM正在申請的專利可以給深度神經(jīng)網(wǎng)絡模型打水印,來保證花費大量人力物力研發(fā)的成果不被盜,IBM共研發(fā)了3種算法,在特定的測試集中完全有效,IBM計劃在公司產(chǎn)品上使用,并逐漸推薦給用戶。

關(guān)鍵意義:“第一次有了一種強有力的方法來證明有人偷了模型,深度神經(jīng)網(wǎng)絡很難建造,任何有價值的東西都會有被偷的可能,包括神經(jīng)網(wǎng)絡?!?/p>

假貨是一個令所有企業(yè)都頭疼的問題,

拼多多最近也因為這事被美國一企業(yè)起訴,

雖然事情真假還未見分曉,

但假貨問題卻在每個行業(yè)中都存在,

包括人工智能領(lǐng)域。

想一想,

如果團隊研究了幾個月甚至是數(shù)年的算法模型被拿走了怎么辦?

現(xiàn)在守護好代碼已經(jīng)不足夠了,

最好的方法是:給自家的模型打上水印,

即使別人拿走了也用不了。

IBM最近就在做這樣的事情。像是給自己制作的視頻、圖片打水印一樣,IBM新申請的專利可以給AI模型打水印。

IBM為神經(jīng)網(wǎng)絡模型添加水印,防止珍貴研究成果被盜

他們的概念最近在韓國舉行的ACM亞洲計算機與通信安全會議(ASIACCS)上發(fā)布了,可能首先在IBM內(nèi)部部署,然后將來逐步推向客戶。

IBM的認知網(wǎng)絡安全智能經(jīng)理斯托克林說:“我們第一次有了一種強有力的方法來證明有人偷了模型。深度神經(jīng)網(wǎng)絡模型需要強大的計算機、神經(jīng)網(wǎng)絡專業(yè)知識和訓練數(shù)據(jù),然后才能擁有一個高度精確的模型。它們很難建造,所以它們很容易被偷。任何有價值的東西都會有被偷的可能,包括神經(jīng)網(wǎng)絡。”

研究人員開發(fā)了三種算法來生成三種相應類型的水?。阂环N將“有意義的內(nèi)容”與算法的原始訓練數(shù)據(jù)結(jié)合在一起,作為水印嵌入到受保護的DNN中;將不相關(guān)的數(shù)據(jù)樣本作為水印嵌入到受保護的DNN中,以及將噪聲作為水印嵌入受保護的DNN中。

IBM為神經(jīng)網(wǎng)絡模型添加水印,防止珍貴研究成果被盜

該團隊測試了三種嵌入算法,其中包括使用MNIST數(shù)據(jù)集、一個包含6萬個訓練圖像和1萬個測試圖像的手寫數(shù)字識別數(shù)據(jù)集,以及包含5萬個訓練圖像和1萬個測試圖像的對象分類數(shù)據(jù)集CIFAR10。

結(jié)果是,斯托克林說,所有這些都是“100%有效的”

IBM為神經(jīng)網(wǎng)絡模型添加水印,防止珍貴研究成果被盜

但是這在線下模式上行不通,盡管斯特克林指出,在這些情況下,抄襲的動機更少,因為這些模型不能被貨幣化,水印框架也無法保護DNN模型不被預測API竊取,攻擊者可以利用結(jié)果中的查詢訪問和機密性之間的張力來學習機器學習模型的參數(shù)。

但該團隊仍在繼續(xù)改進該方法,它將走向生產(chǎn),最終商業(yè)化。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-23
IBM為神經(jīng)網(wǎng)絡模型添加水印,防止珍貴研究成果被盜
關(guān)鍵意義:“第一次有了一種強有力的方法來證明有人偷了模型,深度神經(jīng)網(wǎng)絡很難建造,任何有價值的東西都會有被偷的可能。

長按掃碼 閱讀全文