爬蟲的“緊箍咒“

網(wǎng)絡(luò)爬蟲技術(shù)本為互聯(lián)網(wǎng)行業(yè)的常用技術(shù)之一,被廣泛應(yīng)用到各個領(lǐng)域。人們對于數(shù)據(jù)的采集和分析能力,獲得了大幅的提升。但客觀現(xiàn)實(shí)是,技術(shù)的應(yīng)用,特別是市場化、大規(guī)模的應(yīng)用,往往具有明確的目的性。在很長一段時間內(nèi),惡意爬蟲未經(jīng)授權(quán)肆意抓取、突破robots協(xié)議爬取、同行業(yè)間數(shù)據(jù)爬取,成為常規(guī)操作。

作為信息時代的重要資源,隨著數(shù)字經(jīng)濟(jì)的發(fā)展,數(shù)據(jù)也逐漸成為企業(yè)的一項(xiàng)重要資產(chǎn),能夠產(chǎn)生無窮的商業(yè)價值。11月14日,國家互聯(lián)網(wǎng)信息辦公室對《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》公開征求意見,數(shù)據(jù)合規(guī)再套“緊箍咒“。當(dāng)網(wǎng)絡(luò)平臺或者個人通過技術(shù)手段抓取別的平臺數(shù)據(jù)時,這種行為是否合法,平臺數(shù)據(jù)主體是誰,歸誰使用,數(shù)據(jù)如何流轉(zhuǎn)才能提升市場運(yùn)作效率、對消費(fèi)者福利帶來積極影響,值得深入研討。

數(shù)據(jù)的邏輯

爬蟲技術(shù)作為一項(xiàng)常見的抓取技術(shù),在業(yè)內(nèi)廣泛使用,技術(shù)的發(fā)展也形成了技術(shù)的標(biāo)準(zhǔn)和技術(shù)的規(guī)則。Robots協(xié)議的英文全稱為RobotsExclusionProtocol,指網(wǎng)站所有者通過一個置于網(wǎng)站根目錄下的文本文件,即robots.txt,告知搜索引擎的網(wǎng)絡(luò)機(jī)器人(或稱網(wǎng)絡(luò)爬蟲、網(wǎng)絡(luò)蜘蛛)哪些網(wǎng)頁不應(yīng)被抓取,哪些網(wǎng)頁可以抓取,其本質(zhì)上是受訪網(wǎng)站與搜索引擎之間的一種交互方式。

Robots協(xié)議解決前置性問題,即抓取行為是否得當(dāng)。一方面,robots協(xié)議要求搜索引擎的網(wǎng)絡(luò)機(jī)器人遵守受訪網(wǎng)站的robots協(xié)議,另一方面也要求受訪網(wǎng)站設(shè)置的robots協(xié)議本身應(yīng)當(dāng)是合理的,不應(yīng)違背“促進(jìn)信息共享”的初衷。網(wǎng)絡(luò)服務(wù)商或網(wǎng)站所有者既可以在robots協(xié)議中列明準(zhǔn)許或禁止網(wǎng)絡(luò)機(jī)器人抓取的網(wǎng)站內(nèi)容,也可以列明準(zhǔn)許或不準(zhǔn)許抓取其網(wǎng)站內(nèi)容的網(wǎng)絡(luò)機(jī)器人。但網(wǎng)絡(luò)機(jī)器人識別該robots協(xié)議后,無論是否遵守,robots協(xié)議都不會起到強(qiáng)制禁止訪問的結(jié)果。

2012年11月1日,在中國互聯(lián)網(wǎng)協(xié)會的牽頭組織下,十二家互聯(lián)網(wǎng)企業(yè)簽署了《互聯(lián)網(wǎng)搜索引擎服務(wù)自律公約》(簡稱《自律公約》),第七條第一款規(guī)定:遵循國際通行的行業(yè)慣例與商業(yè)規(guī)則,遵守機(jī)器人協(xié)議(robots協(xié)議)。第八條規(guī)定:互聯(lián)網(wǎng)所有者設(shè)置機(jī)器人協(xié)議應(yīng)遵循公平、開放和促進(jìn)信息自由流動的原則,限制搜索引擎抓取應(yīng)有行業(yè)公認(rèn)合理的正當(dāng)理由,不利用機(jī)器人協(xié)議進(jìn)行不正當(dāng)競爭行為,積極營造鼓勵創(chuàng)新、公平公正的良性競爭環(huán)境。

(一)公開數(shù)據(jù)的限度

提到對公開數(shù)據(jù)的爬取,繞不開的是2016年被列為“影響中國互聯(lián)網(wǎng)法治進(jìn)程十大案例”之一的大眾點(diǎn)評訴百度不正當(dāng)競爭案。

在百度涉案行為的不正當(dāng)競爭性上,上海知識產(chǎn)權(quán)法院認(rèn)為,在判斷經(jīng)營者使用他人信息的相關(guān)行為是否違反商業(yè)道德、擾亂公平競爭的市場秩序的時候,主要應(yīng)綜合考慮公司行為是否具有積極的效果、是否超出了必要的限度、超出必要限度的行為對市場秩序所產(chǎn)生的影響、是否影響競爭行為正當(dāng)性的判斷等方面。百度地圖大量使用大眾點(diǎn)評網(wǎng)的點(diǎn)評信息,替代大眾點(diǎn)評網(wǎng)向網(wǎng)絡(luò)用戶提供信息,會導(dǎo)致大眾點(diǎn)評網(wǎng)的流量減少。百度地圖在大量使用大眾點(diǎn)評網(wǎng)點(diǎn)評信息的同時,又推介自己的團(tuán)購等業(yè)務(wù),攫取了大眾點(diǎn)評網(wǎng)的部分交易機(jī)會。

同樣,作為公開分享平臺,在微博訴“飯友”APP 案中,復(fù)娛公司開發(fā)的“飯友”App在明星帳號中設(shè)置微博專題,并嵌套該明星的新浪微博界面,完整地展示了該明星微博包括界面和內(nèi)容在內(nèi)的全部數(shù)據(jù),還屏蔽了新浪微博中的部分功能且添加了自有功能。這里有兩個行為,一個是爬蟲爬取數(shù)據(jù)的行為,一個是屏蔽微博部分功能替代的行為。

北京市海淀區(qū)人民法院認(rèn)為,新浪可就他人非法抓取并使用該數(shù)據(jù)的行為主張權(quán)益【(2017)京0108民初24510號】。二審北京知識產(chǎn)權(quán)法院維持原判,認(rèn)為微夢公司作為微博運(yùn)營者,對微博前后端全部數(shù)據(jù)享有權(quán)益,并通過微博這一生態(tài)鏈實(shí)現(xiàn)商業(yè)利益?!荆?019)京73民終2799號】

(二)未公開數(shù)據(jù)的限度

現(xiàn)在的爬蟲技術(shù)已經(jīng)從原來的網(wǎng)頁爬蟲進(jìn)入到底層數(shù)據(jù)的爬取。平臺的非公開數(shù)據(jù)通常涉及數(shù)據(jù)安全、用戶隱私以及平臺經(jīng)營者商業(yè)策略的實(shí)現(xiàn)等,系平臺經(jīng)營者的核心資源。業(yè)內(nèi)通行的觀點(diǎn)認(rèn)為,這些數(shù)據(jù)不屬于可自由流動的數(shù)據(jù)范疇,未經(jīng)平臺經(jīng)營者許可,他人不得隨意獲取、使用。

在微博訴“飯友”APP 案中,北京市海淀區(qū)人民法院一審認(rèn)為,鑒于二者的發(fā)布時間,點(diǎn)贊、評論和轉(zhuǎn)發(fā)數(shù)量具體化的程度亦不同,且微博的此類信息相較于飯友App精簡等事實(shí),法院認(rèn)定復(fù)娛公司系通過繞開或破壞微夢公司技術(shù)保護(hù)措施的手段,實(shí)施了抓取和展示微博后臺數(shù)據(jù)之行為。

在抖音訴“小葫蘆”網(wǎng)站案中,浙江省杭州市余杭區(qū)法院審查發(fā)現(xiàn),小葫蘆網(wǎng)站通過“爬蟲”等技術(shù)手段,從抖音等多平臺獲取抖音平臺主播直播數(shù)據(jù)、抖音直播數(shù)據(jù)及抖音直播主播詳情,短視頻數(shù)據(jù)、電商數(shù)據(jù)、輿情分析和用戶畫像等內(nèi)容。小葫蘆網(wǎng)站的行為具有不正當(dāng)性,也存在侵犯用戶隱私可能,還破壞了抖音產(chǎn)品的運(yùn)營邏輯和秩序。法院對小葫蘆網(wǎng)站作出針對非法抓取直播數(shù)據(jù)行為的全國首例禁令。

10月中旬,一家名叫“胖球數(shù)據(jù)”的直播數(shù)據(jù)平臺,也因涉嫌用爬蟲竊取直播相關(guān)數(shù)據(jù)被一鍋端這里面有一個核心問題:數(shù)據(jù)從哪來的。

(三)公開數(shù)據(jù)處理的限度

公開的數(shù)據(jù),是否必然可以無限制使用?還是在大眾點(diǎn)評訴百度不正當(dāng)競爭案中,法院認(rèn)為,在靠自身用戶無法獲取足夠點(diǎn)評信息的情況下,百度公司通過技術(shù)手段,從大眾點(diǎn)評網(wǎng)等網(wǎng)站獲取、大量使用了這些點(diǎn)評信息,其行為具有明顯的“搭便車”、“不勞而獲”的特點(diǎn)。

2021年6月,美國最高法院駁回了下級法院禁止Linkedln阻止hiQ訪問其用戶公開信息的判決,并發(fā)回舊金山第九巡回法庭重審。此前,領(lǐng)英(LinkedIn)認(rèn)為其競爭對手hiQ Labs從公開資料中收集個人數(shù)據(jù)的行為威脅用戶隱私,因而希望阻止這種行為。事實(shí)上,已公開的個人信息是否因已公開狀態(tài),二次處理是否具有正當(dāng)依據(jù),很大程度得進(jìn)行個案考量。

法律的邏輯

在數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)的價值在于流通、開發(fā)和使用,但無論是《個保法》還是《數(shù)據(jù)安全法》,都沒能正面回應(yīng)數(shù)據(jù)財(cái)產(chǎn)權(quán)的歸屬這一問題。《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》只能從使用的角度去強(qiáng)化數(shù)據(jù)處理與流轉(zhuǎn)利用規(guī)則。其中,第七條第二款明確規(guī)定,國家建立健全數(shù)據(jù)交易管理制度,明確數(shù)據(jù)交易機(jī)構(gòu)設(shè)立、運(yùn)行標(biāo)準(zhǔn),規(guī)范數(shù)據(jù)流通交易行為,確保數(shù)據(jù)依法有序流通。司法裁判也在不斷探索數(shù)據(jù)權(quán)益保護(hù)。

互聯(lián)網(wǎng)數(shù)據(jù)中心(DCCI)、未來智庫創(chuàng)始合伙人胡延平認(rèn)為,“開放有開放的合作,合作有合作的玩法,分享也有分享的路徑。不是因?yàn)殚_放,不是因?yàn)槭且粋€互聯(lián)網(wǎng),所有人都可以為所欲為,所有企業(yè)都可以想怎么抓取就怎么抓取?!?p>

(一)授權(quán)的流通

數(shù)據(jù)的搜集和整理往往需要通過投入巨大成本才獲得數(shù)據(jù)。如果沒有限制地讓網(wǎng)絡(luò)爬蟲任意獲取他人通過巨大投入獲取的數(shù)據(jù)資源,不但可能直接違背了用戶的意愿和知情權(quán),也將沒有經(jīng)營者再愿意投入巨額成本進(jìn)行類似的創(chuàng)新性、基礎(chǔ)性的工作,從而抑制經(jīng)營者創(chuàng)新的動力。

在大眾點(diǎn)評訴百度不正當(dāng)競爭案中,法院認(rèn)為,通過法律維護(hù)點(diǎn)評信息使用市場的正當(dāng)競爭秩序,有利于鼓勵經(jīng)營者創(chuàng)新業(yè)務(wù)模式,投入成本改善消費(fèi)者福祉。相反,將沒有經(jīng)營者再愿意投入巨額成本進(jìn)行類似的創(chuàng)新性、基礎(chǔ)性的工作,從而抑制經(jīng)營者創(chuàng)新的動力。

在抖音訴“刷寶”APP 案中,海淀區(qū)人民法院認(rèn)為,微播公司作為抖音 App 的開發(fā)者和運(yùn)營者,投入相應(yīng)的人力、財(cái)力成本,通過正當(dāng)合法的經(jīng)營,吸引用戶發(fā)布、觀看、評論、分享短視頻,積累用戶、短視頻內(nèi)容、流量,并依據(jù)與用戶的協(xié)議在正常的經(jīng)營活動中使用相關(guān)短視頻內(nèi)容,抖音 App 所展示的短視頻內(nèi)容、用戶評論等資源均是微播公司通過正當(dāng)合法的商業(yè)經(jīng)營所獲得,并由此帶來經(jīng)營收益、市場利益及競爭優(yōu)勢,上述合法權(quán)益應(yīng)受反不正當(dāng)競爭法的保護(hù)。

《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》第八條做出了相應(yīng)的規(guī)定,其中第三項(xiàng)規(guī)定,禁止通過竊取或者以其他非法方式獲取數(shù)據(jù)。此外,數(shù)據(jù)處理者向第三方提供個人信息,或者共享、交易、委托處理重要數(shù)據(jù)的還必須遵循告知、明示、約定處理規(guī)則等要求。

這一條的前提是在向用戶明確告知和用戶授權(quán)的前提下,數(shù)據(jù)處理者才能向第三方提供相關(guān)數(shù)據(jù)。反之也可以推導(dǎo)出,如果沒有得到用戶授權(quán),也沒有獲得數(shù)據(jù)處理者的同意,第三方數(shù)據(jù)接收方也沒有約定數(shù)據(jù)的目的、范圍、處理方式和安全保護(hù)措施,第三方數(shù)據(jù)接收方不能獲取更不能使用相關(guān)數(shù)據(jù)。這一點(diǎn)和”三重授權(quán)原則“有本質(zhì)上相似的基本邏輯。

即使相關(guān)行為不“搭便車”,是否就可以全面抓取使用?根據(jù)《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》第十二條第二款規(guī)定,(二)與數(shù)據(jù)接收方約定處理數(shù)據(jù)的目的、范圍、處理方式,數(shù)據(jù)安全保護(hù)措施等,通過合同等形式明確雙方的數(shù)據(jù)安全責(zé)任義務(wù),并對數(shù)據(jù)接收方的數(shù)據(jù)處理活動進(jìn)行監(jiān)督。由此可見,第三方數(shù)據(jù)接收方超首先必須合法獲取公開數(shù)據(jù),其次,如果超過約定的目的、范圍、處理方式處理個人信息和重要數(shù)據(jù),仍然構(gòu)成違法。

(二)合理的流通

在“車來了”不正當(dāng)競爭案中,自 2015 年 11 月起至 2016 年 5 月,武漢元光科技有限公司為了提高其開發(fā)的智能公交應(yīng)用程序“車來了”的市場份額及信息查詢的準(zhǔn)確度,利用網(wǎng)絡(luò)爬蟲技術(shù)大量獲取競爭對手深圳市谷米科技有限公司經(jīng)營的同類公交應(yīng)用程序“酷米客”的實(shí)時公交信息數(shù)據(jù),無償使用于其“車來了”應(yīng)用程序,并向公眾提供查詢服務(wù)。

深圳市中級人民法院在本案中認(rèn)定【(2017)粵03民初822號】,原告谷米公司出于商業(yè)模式或其他需要向公眾免費(fèi)提供數(shù)據(jù)查詢,被告元光公司未經(jīng)權(quán)利人許可,以網(wǎng)絡(luò)爬蟲技術(shù)入侵后臺盜用數(shù)據(jù), 并將盜取數(shù)據(jù)用于經(jīng)營同類業(yè)務(wù)的,具有破壞他人市場競爭優(yōu)勢、謀取競爭優(yōu)勢的主觀故意,屬于嚴(yán)重破壞市場秩序的行為,構(gòu)成不正當(dāng)競爭。

有一個例外,搜索引擎之間相互爬取是否需要獲得授權(quán)?在北京百度網(wǎng)訊科技有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司與北京奇虎科技有限公司不正當(dāng)競爭糾紛案中,北京市高級人民法院二審【(2017)京民終487號】判決認(rèn)為,應(yīng)結(jié)合robots協(xié)議設(shè)置方與被限制方所處的經(jīng)營領(lǐng)域和經(jīng)營內(nèi)容、被限制的網(wǎng)絡(luò)機(jī)器人應(yīng)用場景、robots協(xié)議的設(shè)置對其他經(jīng)營者、消費(fèi)者以及競爭秩序的影響等多種因素進(jìn)行綜合判斷。這并不意味著對于互聯(lián)網(wǎng)企業(yè)所設(shè)置的任何robots協(xié)議均能夠基于企業(yè)自主經(jīng)營權(quán)而當(dāng)然地認(rèn)定其具有正當(dāng)性。

(三)有序的流通

任何流通都必須有序進(jìn)行?;ヂ?lián)網(wǎng)平臺獲取數(shù)據(jù)一般通過兩種方式:一種是通過商業(yè)合作進(jìn)行數(shù)據(jù)交易或交換(如OpenAPI模式),另一種是利用爬蟲技術(shù)自動抓取數(shù)據(jù)的模式。不論是哪一種方式,爬蟲技術(shù)是否中立要看爬蟲的功能及爬蟲使用的目的,不能完全脫離其使用目的而去談它的中立性。在正當(dāng)性判別上,既要考慮平臺的合法權(quán)益和相關(guān)消費(fèi)者的利益,也要考慮是否損害正常的競爭秩序,還要考慮是否足以保障數(shù)據(jù)的安全性。

有電商平臺的負(fù)責(zé)人曾表述,惡意爬蟲案例經(jīng)常發(fā)生在內(nèi)容平臺和電商平臺。在內(nèi)容上被爬取的更多是視頻、圖片、文字、網(wǎng)紅互動數(shù)據(jù)、用戶行為等,在電商領(lǐng)域則多為商家信息和商品信息。這些商業(yè)化、市場化的技術(shù)應(yīng)用背后,往往具有商業(yè)主體明確的目的性。越來越多的司法判決也在厘清一個基本規(guī)則:“有序”和“流轉(zhuǎn)”同等重要、缺一不可。

2014年,北京淘友天下技術(shù)有限公司和北京淘友天下科技發(fā)展有限公司運(yùn)營的脈脈未經(jīng)用戶允許和微博平臺授權(quán),非法抓取、使用新浪微博用戶信息,非法獲取并使用脈脈注冊用戶手機(jī)通訊錄聯(lián)系人與微博用戶的對應(yīng)關(guān)系。該案也被稱為首例大數(shù)據(jù)不正當(dāng)競爭糾紛案。

2017年,北京知識產(chǎn)權(quán)法院終審認(rèn)定,脈脈的經(jīng)營公司未經(jīng)用戶允許和微博平臺授權(quán),非法抓取、使用新浪微博用戶信息,構(gòu)成不正當(dāng)競爭。也就是在該案中,北京知識產(chǎn)權(quán)法院以司法判例方式確立的“三重授權(quán)”原則?!叭亍?,指的是第三方開發(fā)者通過Open API獲得用戶信息時必須遵循“用戶授權(quán)+平臺方公司授權(quán)+用戶授權(quán)”。

(四)競爭的權(quán)益

關(guān)于數(shù)據(jù)和競爭的相關(guān)討論,在大眾點(diǎn)評訴百度不正當(dāng)競爭案中,法院考量漢濤公司是否具備可訴諸法律保護(hù)的合法權(quán)益上,關(guān)注了漢濤公司獲取涉案數(shù)據(jù)信息的成本,以及涉案數(shù)據(jù)信息為漢濤公司帶來的效益。法院認(rèn)為,在百度公司靠自身用戶無法獲取足夠點(diǎn)評信息的情況下,通過技術(shù)手段,從大眾點(diǎn)評等網(wǎng)站獲取點(diǎn)評信息,用于充實(shí)百度地圖,百度公司的這種類似于“搭便車”、“不勞而獲”的行為違反了公認(rèn)的商業(yè)道德和誠實(shí)信用原則,具有不正當(dāng)性。

在微博訴“飯友”APP 案中一審和二審法院均認(rèn)為,飯友App用戶無需注冊或登錄微博帳號即可查看微博全部內(nèi)容,飯友App已對微博構(gòu)成實(shí)質(zhì)性替代;既實(shí)際分流走了微夢公司的潛在用戶流量,也影響了微夢公司通過微博可以獲得的廣告、票務(wù)等商業(yè)收益,給微夢公司實(shí)際造成了損失。

在微博訴今日頭條關(guān)于robots協(xié)議不正當(dāng)競爭糾紛案二審中,北京市高級人民法院認(rèn)為,互聯(lián)網(wǎng)領(lǐng)域中消費(fèi)者福利的增加,依賴于數(shù)據(jù)在更大范圍和更深層次的共享利用,而非通過數(shù)據(jù)爬取對數(shù)據(jù)進(jìn)行明顯替代性或同質(zhì)化地利用。

因?yàn)閿?shù)據(jù)問題引發(fā)的案件還在繼續(xù)。近日,新浪微博因限制其訪問用于分析輿論的數(shù)據(jù),蟻坊軟件公司聲稱向長沙市中級人民法院起訴其涉嫌壟斷。這也是國內(nèi)首例因互聯(lián)網(wǎng)平臺拒絕數(shù)據(jù)許可引發(fā)的反壟斷民事訴訟。此前(2018 年),新浪微博認(rèn)為蟻坊公司采集、使用微博數(shù)據(jù)的行為涉嫌不正當(dāng)競爭,在北京海淀法院提起訴訟。今年 3 月,北京知產(chǎn)法院二審判決蟻坊公司敗訴。

(五)正當(dāng)?shù)倪\(yùn)營

抓取不能侵害其他主體的權(quán)益。如果爬蟲7X24小時自動持續(xù)對被爬取方進(jìn)行訪問,每天達(dá)幾百萬次,甚至上千萬次,這會給服務(wù)器帶來“難以承受”之重,導(dǎo)致受訪網(wǎng)站無法正常運(yùn)行,則有必要對其進(jìn)行限制。

2021年9月14日,杭州互聯(lián)網(wǎng)法院審理一起爬取微信公眾號數(shù)據(jù)中,證據(jù)顯示,斯氏(杭州)新媒體科技有限公司(以下簡稱斯氏公司)運(yùn)營的“極致了”網(wǎng)站使用自動化腳本不間斷爬蟲,繞過原告微信公眾平臺的反爬措施,,還通過多個代理IP操作,繞過封號、封IP等防護(hù)措施,日均訪問量達(dá)70余萬次。

2019年公布的《數(shù)據(jù)安全管理辦法(征求意見稿)》第16條規(guī)定,網(wǎng)絡(luò)運(yùn)營者采取自動化手段訪問收集網(wǎng)站數(shù)據(jù),不得妨礙網(wǎng)站正常運(yùn)行;此類行為嚴(yán)重影響網(wǎng)站運(yùn)行,如自動化訪問收集流量超過網(wǎng)站日均流量三分之一,網(wǎng)站要求停止自動化訪問收集時,應(yīng)當(dāng)停止。

這一管理辦法后被11月14日公布的《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》取代。其中第十七條對企業(yè)運(yùn)營網(wǎng)絡(luò)爬蟲的規(guī)制做了更明確規(guī)定:數(shù)據(jù)處理者在采用自動化工具訪問、收集數(shù)據(jù)時,應(yīng)當(dāng)評估對網(wǎng)絡(luò)服務(wù)的性能、功能帶來的影響,不得干擾網(wǎng)絡(luò)服務(wù)的正常功能。自動化工具訪問、收集數(shù)據(jù)違反法律、行政法規(guī)或者行業(yè)自律公約、影響網(wǎng)絡(luò)服務(wù)正常功能,或者侵犯他人知識產(chǎn)權(quán)等合法權(quán)益的,數(shù)據(jù)處理者應(yīng)當(dāng)停止訪問、收集數(shù)據(jù)行為并采取相應(yīng)補(bǔ)救措施。

(六)安全的底線

依據(jù)《網(wǎng)絡(luò)安全法》第四十一條取得被收集者同意即自動抓取個人信息,技術(shù)使用者即涉嫌構(gòu)成侵犯公民個人信息罪、非法侵入計(jì)算機(jī)信息系統(tǒng)罪或非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪等相關(guān)罪名。刑事案件中,往往沒有對數(shù)據(jù)的權(quán)屬進(jìn)行定性,而是更傾向于從行為和結(jié)果進(jìn)行定罪。

2021年2月,上海徐匯區(qū)檢察院通報(bào),某網(wǎng)絡(luò)公司在未經(jīng)被害公司授權(quán)許可的情況下,被告人李某決策通過非法手段抓取對方直播數(shù)據(jù)并出售牟利被提起公訴。2021年6月,河南省商丘市睢陽區(qū)人民法院公布的刑事判決書【(2021)豫1403刑初78號】顯示,逯某和黎某兩男子通過自己開發(fā)的爬蟲軟件,對淘寶實(shí)施了長達(dá)八個月的數(shù)據(jù)爬取,非法獲取近12億條用戶消息。

在“車來了”APP爬取“酷米客”APP公交車行駛實(shí)時數(shù)據(jù)案不正當(dāng)競爭判決之前,南山區(qū)人民法院在刑事判決【(2017)粵0305刑初153號】中認(rèn)定,邵xx等五人的行為已構(gòu)成非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪,谷米公司因被非法侵入計(jì)算機(jī)信息系統(tǒng)所造成的直接經(jīng)濟(jì)損失為24.43萬元。

在張xx等非法獲取計(jì)算機(jī)系統(tǒng)數(shù)據(jù)案【(2017)京 0108 刑初 2384 號】中 ,被告人張xx、宋x、侯xx作為被告單位上海晟品網(wǎng)絡(luò)科技有限公司主管人員,采用技術(shù)手段破解被害單位的防抓取措施,使用偽造device_id繞過服務(wù)器的身份校驗(yàn),使用偽造UA及IP繞過服務(wù)器的訪問頻率限制,造成被害單位損失技術(shù)服務(wù)費(fèi)2萬元,北京市海淀區(qū)人民法院以該行為侵入計(jì)算機(jī)系統(tǒng)的技術(shù)方式獲取服務(wù)器存儲數(shù)據(jù),構(gòu)成“非法獲取計(jì)算機(jī)系統(tǒng)數(shù)據(jù)罪”定罪。

(七)全鏈條的風(fēng)控

同樣還需要關(guān)注的是,數(shù)據(jù)資源一旦流通,原數(shù)據(jù)所有者就很難對其用途進(jìn)行追蹤、控制。例如,在“劍橋數(shù)據(jù)門”事件中,臉書對劍橋分析公司開放了數(shù)據(jù),而后來劍橋分析公司用這些數(shù)據(jù)所做的事情引發(fā)了立法者和監(jiān)管機(jī)構(gòu)的審查。這也對Facebook造成了重大影響,隨后Facebook出于多種原因而暫時封禁數(shù)萬個應(yīng)用。

也正是基于此,《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》對于數(shù)據(jù)合作中的數(shù)據(jù)處理活動進(jìn)行監(jiān)督,關(guān)注全球化時代背景下數(shù)據(jù)全鏈條的安全。第十二條第一款第二項(xiàng)規(guī)定:(二)與數(shù)據(jù)接收方約定處理數(shù)據(jù)的目的、范圍、處理方式,數(shù)據(jù)安全保護(hù)措施等,通過合同等形式明確雙方的數(shù)據(jù)安全責(zé)任義務(wù),并對數(shù)據(jù)接收方的數(shù)據(jù)處理活動進(jìn)行監(jiān)督。第二款規(guī)定:數(shù)據(jù)接收方應(yīng)當(dāng)履行約定的義務(wù),不得超出約定的目的、范圍、處理方式處理個人信息和重要數(shù)據(jù)。

由此可見,第三方數(shù)據(jù)接收方首先必須合法獲取公開數(shù)據(jù),其次,如果超過約定的目的、范圍、處理方式處理個人信息和重要數(shù)據(jù),仍然構(gòu)成違法。

數(shù)據(jù)相關(guān)案件不完全列表:2016年,“車來了”APP爬取“酷米客”APP公交車行駛實(shí)時數(shù)據(jù)案2017年,脈脈非法抓取使用新浪微博用戶信息案2017年,今日頭條未經(jīng)授權(quán)移植新浪微博大V賬號內(nèi)容數(shù)據(jù)案2019年,刷寶APP爬取抖音APP短視頻及用戶評論數(shù)據(jù)案2020年,北京朝陽:員工通過“暗網(wǎng)”出售客戶信息案2021年,“極致了”網(wǎng)站爬取微信公眾號文章數(shù)據(jù)案2021年,魔蝎數(shù)據(jù)科技有限公司侵犯公民個人信息案2021年,上海浦東:公司非法爬取個人信息開展征信業(yè)務(wù)出售牟利案2021年,斯氏(杭州)新媒體科技有限公司爬取微信公眾號平臺數(shù)據(jù)案(來源:獵云網(wǎng))

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 簡版
  • 原版
  • 投稿
  • 回頂部
2021-11-22
爬蟲的“緊箍咒“
數(shù)據(jù)逐漸成為企業(yè)的一項(xiàng)重要資產(chǎn),能夠產(chǎn)生無窮的商業(yè)價值。

長按掃碼 閱讀全文