網(wǎng)絡(luò)爬蟲(chóng)技術(shù)本為互聯(lián)網(wǎng)行業(yè)的常用技術(shù)之一,被廣泛應(yīng)用到各個(gè)領(lǐng)域。人們對(duì)于數(shù)據(jù)的采集和分析能力,獲得了大幅的提升。但客觀現(xiàn)實(shí)是,技術(shù)的應(yīng)用,特別是市場(chǎng)化、大規(guī)模的應(yīng)用,往往具有明確的目的性。在很長(zhǎng)一段時(shí)間內(nèi),惡意爬蟲(chóng)未經(jīng)授權(quán)肆意抓取、突破robots協(xié)議爬取、同行業(yè)間數(shù)據(jù)爬取,成為常規(guī)操作。
作為信息時(shí)代的重要資源,隨著數(shù)字經(jīng)濟(jì)的發(fā)展,數(shù)據(jù)也逐漸成為企業(yè)的一項(xiàng)重要資產(chǎn),能夠產(chǎn)生無(wú)窮的商業(yè)價(jià)值。11月14日,國(guó)家互聯(lián)網(wǎng)信息辦公室對(duì)《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》公開(kāi)征求意見(jiàn),數(shù)據(jù)合規(guī)再套“緊箍咒“。當(dāng)網(wǎng)絡(luò)平臺(tái)或者個(gè)人通過(guò)技術(shù)手段抓取別的平臺(tái)數(shù)據(jù)時(shí),這種行為是否合法,平臺(tái)數(shù)據(jù)主體是誰(shuí),歸誰(shuí)使用,數(shù)據(jù)如何流轉(zhuǎn)才能提升市場(chǎng)運(yùn)作效率、對(duì)消費(fèi)者福利帶來(lái)積極影響,值得深入研討。
數(shù)據(jù)的邏輯
爬蟲(chóng)技術(shù)作為一項(xiàng)常見(jiàn)的抓取技術(shù),在業(yè)內(nèi)廣泛使用,技術(shù)的發(fā)展也形成了技術(shù)的標(biāo)準(zhǔn)和技術(shù)的規(guī)則。Robots協(xié)議的英文全稱(chēng)為RobotsExclusionProtocol,指網(wǎng)站所有者通過(guò)一個(gè)置于網(wǎng)站根目錄下的文本文件,即robots.txt,告知搜索引擎的網(wǎng)絡(luò)機(jī)器人(或稱(chēng)網(wǎng)絡(luò)爬蟲(chóng)、網(wǎng)絡(luò)蜘蛛)哪些網(wǎng)頁(yè)不應(yīng)被抓取,哪些網(wǎng)頁(yè)可以抓取,其本質(zhì)上是受訪網(wǎng)站與搜索引擎之間的一種交互方式。
Robots協(xié)議解決前置性問(wèn)題,即抓取行為是否得當(dāng)。一方面,robots協(xié)議要求搜索引擎的網(wǎng)絡(luò)機(jī)器人遵守受訪網(wǎng)站的robots協(xié)議,另一方面也要求受訪網(wǎng)站設(shè)置的robots協(xié)議本身應(yīng)當(dāng)是合理的,不應(yīng)違背“促進(jìn)信息共享”的初衷。網(wǎng)絡(luò)服務(wù)商或網(wǎng)站所有者既可以在robots協(xié)議中列明準(zhǔn)許或禁止網(wǎng)絡(luò)機(jī)器人抓取的網(wǎng)站內(nèi)容,也可以列明準(zhǔn)許或不準(zhǔn)許抓取其網(wǎng)站內(nèi)容的網(wǎng)絡(luò)機(jī)器人。但網(wǎng)絡(luò)機(jī)器人識(shí)別該robots協(xié)議后,無(wú)論是否遵守,robots協(xié)議都不會(huì)起到強(qiáng)制禁止訪問(wèn)的結(jié)果。
2012年11月1日,在中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)的牽頭組織下,十二家互聯(lián)網(wǎng)企業(yè)簽署了《互聯(lián)網(wǎng)搜索引擎服務(wù)自律公約》(簡(jiǎn)稱(chēng)《自律公約》),第七條第一款規(guī)定:遵循國(guó)際通行的行業(yè)慣例與商業(yè)規(guī)則,遵守機(jī)器人協(xié)議(robots協(xié)議)。第八條規(guī)定:互聯(lián)網(wǎng)所有者設(shè)置機(jī)器人協(xié)議應(yīng)遵循公平、開(kāi)放和促進(jìn)信息自由流動(dòng)的原則,限制搜索引擎抓取應(yīng)有行業(yè)公認(rèn)合理的正當(dāng)理由,不利用機(jī)器人協(xié)議進(jìn)行不正當(dāng)競(jìng)爭(zhēng)行為,積極營(yíng)造鼓勵(lì)創(chuàng)新、公平公正的良性競(jìng)爭(zhēng)環(huán)境。
(一)公開(kāi)數(shù)據(jù)的限度 提到對(duì)公開(kāi)數(shù)據(jù)的爬取,繞不開(kāi)的是2016年被列為“影響中國(guó)互聯(lián)網(wǎng)法治進(jìn)程十大案例”之一的大眾點(diǎn)評(píng)訴百度不正當(dāng)競(jìng)爭(zhēng)案。 在百度涉案行為的不正當(dāng)競(jìng)爭(zhēng)性上,上海知識(shí)產(chǎn)權(quán)法院認(rèn)為,在判斷經(jīng)營(yíng)者使用他人信息的相關(guān)行為是否違反商業(yè)道德、擾亂公平競(jìng)爭(zhēng)的市場(chǎng)秩序的時(shí)候,主要應(yīng)綜合考慮公司行為是否具有積極的效果、是否超出了必要的限度、超出必要限度的行為對(duì)市場(chǎng)秩序所產(chǎn)生的影響、是否影響競(jìng)爭(zhēng)行為正當(dāng)性的判斷等方面。百度地圖大量使用大眾點(diǎn)評(píng)網(wǎng)的點(diǎn)評(píng)信息,替代大眾點(diǎn)評(píng)網(wǎng)向網(wǎng)絡(luò)用戶(hù)提供信息,會(huì)導(dǎo)致大眾點(diǎn)評(píng)網(wǎng)的流量減少。百度地圖在大量使用大眾點(diǎn)評(píng)網(wǎng)點(diǎn)評(píng)信息的同時(shí),又推介自己的團(tuán)購(gòu)等業(yè)務(wù),攫取了大眾點(diǎn)評(píng)網(wǎng)的部分交易機(jī)會(huì)。 同樣,作為公開(kāi)分享平臺(tái),在微博訴“飯友”APP 案中,復(fù)娛公司開(kāi)發(fā)的“飯友”App在明星帳號(hào)中設(shè)置微博專(zhuān)題,并嵌套該明星的新浪微博界面,完整地展示了該明星微博包括界面和內(nèi)容在內(nèi)的全部數(shù)據(jù),還屏蔽了新浪微博中的部分功能且添加了自有功能。這里有兩個(gè)行為,一個(gè)是爬蟲(chóng)爬取數(shù)據(jù)的行為,一個(gè)是屏蔽微博部分功能替代的行為。 北京市海淀區(qū)人民法院認(rèn)為,新浪可就他人非法抓取并使用該數(shù)據(jù)的行為主張權(quán)益【(2017)京0108民初24510號(hào)】。二審北京知識(shí)產(chǎn)權(quán)法院維持原判,認(rèn)為微夢(mèng)公司作為微博運(yùn)營(yíng)者,對(duì)微博前后端全部數(shù)據(jù)享有權(quán)益,并通過(guò)微博這一生態(tài)鏈實(shí)現(xiàn)商業(yè)利益。【(2019)京73民終2799號(hào)】 (二)未公開(kāi)數(shù)據(jù)的限度 現(xiàn)在的爬蟲(chóng)技術(shù)已經(jīng)從原來(lái)的網(wǎng)頁(yè)爬蟲(chóng)進(jìn)入到底層數(shù)據(jù)的爬取。平臺(tái)的非公開(kāi)數(shù)據(jù)通常涉及數(shù)據(jù)安全、用戶(hù)隱私以及平臺(tái)經(jīng)營(yíng)者商業(yè)策略的實(shí)現(xiàn)等,系平臺(tái)經(jīng)營(yíng)者的核心資源。業(yè)內(nèi)通行的觀點(diǎn)認(rèn)為,這些數(shù)據(jù)不屬于可自由流動(dòng)的數(shù)據(jù)范疇,未經(jīng)平臺(tái)經(jīng)營(yíng)者許可,他人不得隨意獲取、使用。 在微博訴“飯友”APP 案中,北京市海淀區(qū)人民法院一審認(rèn)為,鑒于二者的發(fā)布時(shí)間,點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)數(shù)量具體化的程度亦不同,且微博的此類(lèi)信息相較于飯友App精簡(jiǎn)等事實(shí),法院認(rèn)定復(fù)娛公司系通過(guò)繞開(kāi)或破壞微夢(mèng)公司技術(shù)保護(hù)措施的手段,實(shí)施了抓取和展示微博后臺(tái)數(shù)據(jù)之行為。 在抖音訴“小葫蘆”網(wǎng)站案中,浙江省杭州市余杭區(qū)法院審查發(fā)現(xiàn),小葫蘆網(wǎng)站通過(guò)“爬蟲(chóng)”等技術(shù)手段,從抖音等多平臺(tái)獲取抖音平臺(tái)主播直播數(shù)據(jù)、抖音直播數(shù)據(jù)及抖音直播主播詳情,短視頻數(shù)據(jù)、電商數(shù)據(jù)、輿情分析和用戶(hù)畫(huà)像等內(nèi)容。小葫蘆網(wǎng)站的行為具有不正當(dāng)性,也存在侵犯用戶(hù)隱私可能,還破壞了抖音產(chǎn)品的運(yùn)營(yíng)邏輯和秩序。法院對(duì)小葫蘆網(wǎng)站作出針對(duì)非法抓取直播數(shù)據(jù)行為的全國(guó)首例禁令。 10月中旬,一家名叫“胖球數(shù)據(jù)”的直播數(shù)據(jù)平臺(tái),也因涉嫌用爬蟲(chóng)竊取直播相關(guān)數(shù)據(jù)被一鍋端這里面有一個(gè)核心問(wèn)題:數(shù)據(jù)從哪來(lái)的。 (三)公開(kāi)數(shù)據(jù)處理的限度 公開(kāi)的數(shù)據(jù),是否必然可以無(wú)限制使用?還是在大眾點(diǎn)評(píng)訴百度不正當(dāng)競(jìng)爭(zhēng)案中,法院認(rèn)為,在靠自身用戶(hù)無(wú)法獲取足夠點(diǎn)評(píng)信息的情況下,百度公司通過(guò)技術(shù)手段,從大眾點(diǎn)評(píng)網(wǎng)等網(wǎng)站獲取、大量使用了這些點(diǎn)評(píng)信息,其行為具有明顯的“搭便車(chē)”、“不勞而獲”的特點(diǎn)。 2021年6月,美國(guó)最高法院駁回了下級(jí)法院禁止Linkedln阻止hiQ訪問(wèn)其用戶(hù)公開(kāi)信息的判決,并發(fā)回舊金山第九巡回法庭重審。此前,領(lǐng)英(LinkedIn)認(rèn)為其競(jìng)爭(zhēng)對(duì)手hiQ Labs從公開(kāi)資料中收集個(gè)人數(shù)據(jù)的行為威脅用戶(hù)隱私,因而希望阻止這種行為。事實(shí)上,已公開(kāi)的個(gè)人信息是否因已公開(kāi)狀態(tài),二次處理是否具有正當(dāng)依據(jù),很大程度得進(jìn)行個(gè)案考量。 法律的邏輯 在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)的價(jià)值在于流通、開(kāi)發(fā)和使用,但無(wú)論是《個(gè)保法》還是《數(shù)據(jù)安全法》,都沒(méi)能正面回應(yīng)數(shù)據(jù)財(cái)產(chǎn)權(quán)的歸屬這一問(wèn)題?!毒W(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》只能從使用的角度去強(qiáng)化數(shù)據(jù)處理與流轉(zhuǎn)利用規(guī)則。其中,第七條第二款明確規(guī)定,國(guó)家建立健全數(shù)據(jù)交易管理制度,明確數(shù)據(jù)交易機(jī)構(gòu)設(shè)立、運(yùn)行標(biāo)準(zhǔn),規(guī)范數(shù)據(jù)流通交易行為,確保數(shù)據(jù)依法有序流通。司法裁判也在不斷探索數(shù)據(jù)權(quán)益保護(hù)。 互聯(lián)網(wǎng)數(shù)據(jù)中心(DCCI)、未來(lái)智庫(kù)創(chuàng)始合伙人胡延平認(rèn)為,“開(kāi)放有開(kāi)放的合作,合作有合作的玩法,分享也有分享的路徑。不是因?yàn)殚_(kāi)放,不是因?yàn)槭且粋€(gè)互聯(lián)網(wǎng),所有人都可以為所欲為,所有企業(yè)都可以想怎么抓取就怎么抓取?!?p> (一)授權(quán)的流通 數(shù)據(jù)的搜集和整理往往需要通過(guò)投入巨大成本才獲得數(shù)據(jù)。如果沒(méi)有限制地讓網(wǎng)絡(luò)爬蟲(chóng)任意獲取他人通過(guò)巨大投入獲取的數(shù)據(jù)資源,不但可能直接違背了用戶(hù)的意愿和知情權(quán),也將沒(méi)有經(jīng)營(yíng)者再愿意投入巨額成本進(jìn)行類(lèi)似的創(chuàng)新性、基礎(chǔ)性的工作,從而抑制經(jīng)營(yíng)者創(chuàng)新的動(dòng)力。 在大眾點(diǎn)評(píng)訴百度不正當(dāng)競(jìng)爭(zhēng)案中,法院認(rèn)為,通過(guò)法律維護(hù)點(diǎn)評(píng)信息使用市場(chǎng)的正當(dāng)競(jìng)爭(zhēng)秩序,有利于鼓勵(lì)經(jīng)營(yíng)者創(chuàng)新業(yè)務(wù)模式,投入成本改善消費(fèi)者福祉。相反,將沒(méi)有經(jīng)營(yíng)者再愿意投入巨額成本進(jìn)行類(lèi)似的創(chuàng)新性、基礎(chǔ)性的工作,從而抑制經(jīng)營(yíng)者創(chuàng)新的動(dòng)力。 在抖音訴“刷寶”APP 案中,海淀區(qū)人民法院認(rèn)為,微播公司作為抖音 App 的開(kāi)發(fā)者和運(yùn)營(yíng)者,投入相應(yīng)的人力、財(cái)力成本,通過(guò)正當(dāng)合法的經(jīng)營(yíng),吸引用戶(hù)發(fā)布、觀看、評(píng)論、分享短視頻,積累用戶(hù)、短視頻內(nèi)容、流量,并依據(jù)與用戶(hù)的協(xié)議在正常的經(jīng)營(yíng)活動(dòng)中使用相關(guān)短視頻內(nèi)容,抖音 App 所展示的短視頻內(nèi)容、用戶(hù)評(píng)論等資源均是微播公司通過(guò)正當(dāng)合法的商業(yè)經(jīng)營(yíng)所獲得,并由此帶來(lái)經(jīng)營(yíng)收益、市場(chǎng)利益及競(jìng)爭(zhēng)優(yōu)勢(shì),上述合法權(quán)益應(yīng)受反不正當(dāng)競(jìng)爭(zhēng)法的保護(hù)。 《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》第八條做出了相應(yīng)的規(guī)定,其中第三項(xiàng)規(guī)定,禁止通過(guò)竊取或者以其他非法方式獲取數(shù)據(jù)。此外,數(shù)據(jù)處理者向第三方提供個(gè)人信息,或者共享、交易、委托處理重要數(shù)據(jù)的還必須遵循告知、明示、約定處理規(guī)則等要求。 這一條的前提是在向用戶(hù)明確告知和用戶(hù)授權(quán)的前提下,數(shù)據(jù)處理者才能向第三方提供相關(guān)數(shù)據(jù)。反之也可以推導(dǎo)出,如果沒(méi)有得到用戶(hù)授權(quán),也沒(méi)有獲得數(shù)據(jù)處理者的同意,第三方數(shù)據(jù)接收方也沒(méi)有約定數(shù)據(jù)的目的、范圍、處理方式和安全保護(hù)措施,第三方數(shù)據(jù)接收方不能獲取更不能使用相關(guān)數(shù)據(jù)。這一點(diǎn)和”三重授權(quán)原則“有本質(zhì)上相似的基本邏輯。 即使相關(guān)行為不“搭便車(chē)”,是否就可以全面抓取使用?根據(jù)《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》第十二條第二款規(guī)定,(二)與數(shù)據(jù)接收方約定處理數(shù)據(jù)的目的、范圍、處理方式,數(shù)據(jù)安全保護(hù)措施等,通過(guò)合同等形式明確雙方的數(shù)據(jù)安全責(zé)任義務(wù),并對(duì)數(shù)據(jù)接收方的數(shù)據(jù)處理活動(dòng)進(jìn)行監(jiān)督。由此可見(jiàn),第三方數(shù)據(jù)接收方超首先必須合法獲取公開(kāi)數(shù)據(jù),其次,如果超過(guò)約定的目的、范圍、處理方式處理個(gè)人信息和重要數(shù)據(jù),仍然構(gòu)成違法。 (二)合理的流通 在“車(chē)來(lái)了”不正當(dāng)競(jìng)爭(zhēng)案中,自 2015 年 11 月起至 2016 年 5 月,武漢元光科技有限公司為了提高其開(kāi)發(fā)的智能公交應(yīng)用程序“車(chē)來(lái)了”的市場(chǎng)份額及信息查詢(xún)的準(zhǔn)確度,利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)大量獲取競(jìng)爭(zhēng)對(duì)手深圳市谷米科技有限公司經(jīng)營(yíng)的同類(lèi)公交應(yīng)用程序“酷米客”的實(shí)時(shí)公交信息數(shù)據(jù),無(wú)償使用于其“車(chē)來(lái)了”應(yīng)用程序,并向公眾提供查詢(xún)服務(wù)。 深圳市中級(jí)人民法院在本案中認(rèn)定【(2017)粵03民初822號(hào)】,原告谷米公司出于商業(yè)模式或其他需要向公眾免費(fèi)提供數(shù)據(jù)查詢(xún),被告元光公司未經(jīng)權(quán)利人許可,以網(wǎng)絡(luò)爬蟲(chóng)技術(shù)入侵后臺(tái)盜用數(shù)據(jù), 并將盜取數(shù)據(jù)用于經(jīng)營(yíng)同類(lèi)業(yè)務(wù)的,具有破壞他人市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)、謀取競(jìng)爭(zhēng)優(yōu)勢(shì)的主觀故意,屬于嚴(yán)重破壞市場(chǎng)秩序的行為,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。 有一個(gè)例外,搜索引擎之間相互爬取是否需要獲得授權(quán)?在北京百度網(wǎng)訊科技有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司與北京奇虎科技有限公司不正當(dāng)競(jìng)爭(zhēng)糾紛案中,北京市高級(jí)人民法院二審【(2017)京民終487號(hào)】判決認(rèn)為,應(yīng)結(jié)合robots協(xié)議設(shè)置方與被限制方所處的經(jīng)營(yíng)領(lǐng)域和經(jīng)營(yíng)內(nèi)容、被限制的網(wǎng)絡(luò)機(jī)器人應(yīng)用場(chǎng)景、robots協(xié)議的設(shè)置對(duì)其他經(jīng)營(yíng)者、消費(fèi)者以及競(jìng)爭(zhēng)秩序的影響等多種因素進(jìn)行綜合判斷。這并不意味著對(duì)于互聯(lián)網(wǎng)企業(yè)所設(shè)置的任何robots協(xié)議均能夠基于企業(yè)自主經(jīng)營(yíng)權(quán)而當(dāng)然地認(rèn)定其具有正當(dāng)性。 (三)有序的流通 任何流通都必須有序進(jìn)行?;ヂ?lián)網(wǎng)平臺(tái)獲取數(shù)據(jù)一般通過(guò)兩種方式:一種是通過(guò)商業(yè)合作進(jìn)行數(shù)據(jù)交易或交換(如OpenAPI模式),另一種是利用爬蟲(chóng)技術(shù)自動(dòng)抓取數(shù)據(jù)的模式。不論是哪一種方式,爬蟲(chóng)技術(shù)是否中立要看爬蟲(chóng)的功能及爬蟲(chóng)使用的目的,不能完全脫離其使用目的而去談它的中立性。在正當(dāng)性判別上,既要考慮平臺(tái)的合法權(quán)益和相關(guān)消費(fèi)者的利益,也要考慮是否損害正常的競(jìng)爭(zhēng)秩序,還要考慮是否足以保障數(shù)據(jù)的安全性。 有電商平臺(tái)的負(fù)責(zé)人曾表述,惡意爬蟲(chóng)案例經(jīng)常發(fā)生在內(nèi)容平臺(tái)和電商平臺(tái)。在內(nèi)容上被爬取的更多是視頻、圖片、文字、網(wǎng)紅互動(dòng)數(shù)據(jù)、用戶(hù)行為等,在電商領(lǐng)域則多為商家信息和商品信息。這些商業(yè)化、市場(chǎng)化的技術(shù)應(yīng)用背后,往往具有商業(yè)主體明確的目的性。越來(lái)越多的司法判決也在厘清一個(gè)基本規(guī)則:“有序”和“流轉(zhuǎn)”同等重要、缺一不可。 2014年,北京淘友天下技術(shù)有限公司和北京淘友天下科技發(fā)展有限公司運(yùn)營(yíng)的脈脈未經(jīng)用戶(hù)允許和微博平臺(tái)授權(quán),非法抓取、使用新浪微博用戶(hù)信息,非法獲取并使用脈脈注冊(cè)用戶(hù)手機(jī)通訊錄聯(lián)系人與微博用戶(hù)的對(duì)應(yīng)關(guān)系。該案也被稱(chēng)為首例大數(shù)據(jù)不正當(dāng)競(jìng)爭(zhēng)糾紛案。 2017年,北京知識(shí)產(chǎn)權(quán)法院終審認(rèn)定,脈脈的經(jīng)營(yíng)公司未經(jīng)用戶(hù)允許和微博平臺(tái)授權(quán),非法抓取、使用新浪微博用戶(hù)信息,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。也就是在該案中,北京知識(shí)產(chǎn)權(quán)法院以司法判例方式確立的“三重授權(quán)”原則。“三重”,指的是第三方開(kāi)發(fā)者通過(guò)Open API獲得用戶(hù)信息時(shí)必須遵循“用戶(hù)授權(quán)+平臺(tái)方公司授權(quán)+用戶(hù)授權(quán)”。 (四)競(jìng)爭(zhēng)的權(quán)益 關(guān)于數(shù)據(jù)和競(jìng)爭(zhēng)的相關(guān)討論,在大眾點(diǎn)評(píng)訴百度不正當(dāng)競(jìng)爭(zhēng)案中,法院考量漢濤公司是否具備可訴諸法律保護(hù)的合法權(quán)益上,關(guān)注了漢濤公司獲取涉案數(shù)據(jù)信息的成本,以及涉案數(shù)據(jù)信息為漢濤公司帶來(lái)的效益。法院認(rèn)為,在百度公司靠自身用戶(hù)無(wú)法獲取足夠點(diǎn)評(píng)信息的情況下,通過(guò)技術(shù)手段,從大眾點(diǎn)評(píng)等網(wǎng)站獲取點(diǎn)評(píng)信息,用于充實(shí)百度地圖,百度公司的這種類(lèi)似于“搭便車(chē)”、“不勞而獲”的行為違反了公認(rèn)的商業(yè)道德和誠(chéng)實(shí)信用原則,具有不正當(dāng)性。 在微博訴“飯友”APP 案中一審和二審法院均認(rèn)為,飯友App用戶(hù)無(wú)需注冊(cè)或登錄微博帳號(hào)即可查看微博全部?jī)?nèi)容,飯友App已對(duì)微博構(gòu)成實(shí)質(zhì)性替代;既實(shí)際分流走了微夢(mèng)公司的潛在用戶(hù)流量,也影響了微夢(mèng)公司通過(guò)微博可以獲得的廣告、票務(wù)等商業(yè)收益,給微夢(mèng)公司實(shí)際造成了損失。 在微博訴今日頭條關(guān)于robots協(xié)議不正當(dāng)競(jìng)爭(zhēng)糾紛案二審中,北京市高級(jí)人民法院認(rèn)為,互聯(lián)網(wǎng)領(lǐng)域中消費(fèi)者福利的增加,依賴(lài)于數(shù)據(jù)在更大范圍和更深層次的共享利用,而非通過(guò)數(shù)據(jù)爬取對(duì)數(shù)據(jù)進(jìn)行明顯替代性或同質(zhì)化地利用。 因?yàn)閿?shù)據(jù)問(wèn)題引發(fā)的案件還在繼續(xù)。近日,新浪微博因限制其訪問(wèn)用于分析輿論的數(shù)據(jù),蟻坊軟件公司聲稱(chēng)向長(zhǎng)沙市中級(jí)人民法院起訴其涉嫌壟斷。這也是國(guó)內(nèi)首例因互聯(lián)網(wǎng)平臺(tái)拒絕數(shù)據(jù)許可引發(fā)的反壟斷民事訴訟。此前(2018 年),新浪微博認(rèn)為蟻坊公司采集、使用微博數(shù)據(jù)的行為涉嫌不正當(dāng)競(jìng)爭(zhēng),在北京海淀法院提起訴訟。今年 3 月,北京知產(chǎn)法院二審判決蟻坊公司敗訴。 (五)正當(dāng)?shù)倪\(yùn)營(yíng) 抓取不能侵害其他主體的權(quán)益。如果爬蟲(chóng)7X24小時(shí)自動(dòng)持續(xù)對(duì)被爬取方進(jìn)行訪問(wèn),每天達(dá)幾百萬(wàn)次,甚至上千萬(wàn)次,這會(huì)給服務(wù)器帶來(lái)“難以承受”之重,導(dǎo)致受訪網(wǎng)站無(wú)法正常運(yùn)行,則有必要對(duì)其進(jìn)行限制。 2021年9月14日,杭州互聯(lián)網(wǎng)法院審理一起爬取微信公眾號(hào)數(shù)據(jù)中,證據(jù)顯示,斯氏(杭州)新媒體科技有限公司(以下簡(jiǎn)稱(chēng)斯氏公司)運(yùn)營(yíng)的“極致了”網(wǎng)站使用自動(dòng)化腳本不間斷爬蟲(chóng),繞過(guò)原告微信公眾平臺(tái)的反爬措施,,還通過(guò)多個(gè)代理IP操作,繞過(guò)封號(hào)、封IP等防護(hù)措施,日均訪問(wèn)量達(dá)70余萬(wàn)次。 2019年公布的《數(shù)據(jù)安全管理辦法(征求意見(jiàn)稿)》第16條規(guī)定,網(wǎng)絡(luò)運(yùn)營(yíng)者采取自動(dòng)化手段訪問(wèn)收集網(wǎng)站數(shù)據(jù),不得妨礙網(wǎng)站正常運(yùn)行;此類(lèi)行為嚴(yán)重影響網(wǎng)站運(yùn)行,如自動(dòng)化訪問(wèn)收集流量超過(guò)網(wǎng)站日均流量三分之一,網(wǎng)站要求停止自動(dòng)化訪問(wèn)收集時(shí),應(yīng)當(dāng)停止。 這一管理辦法后被11月14日公布的《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》取代。其中第十七條對(duì)企業(yè)運(yùn)營(yíng)網(wǎng)絡(luò)爬蟲(chóng)的規(guī)制做了更明確規(guī)定:數(shù)據(jù)處理者在采用自動(dòng)化工具訪問(wèn)、收集數(shù)據(jù)時(shí),應(yīng)當(dāng)評(píng)估對(duì)網(wǎng)絡(luò)服務(wù)的性能、功能帶來(lái)的影響,不得干擾網(wǎng)絡(luò)服務(wù)的正常功能。自動(dòng)化工具訪問(wèn)、收集數(shù)據(jù)違反法律、行政法規(guī)或者行業(yè)自律公約、影響網(wǎng)絡(luò)服務(wù)正常功能,或者侵犯他人知識(shí)產(chǎn)權(quán)等合法權(quán)益的,數(shù)據(jù)處理者應(yīng)當(dāng)停止訪問(wèn)、收集數(shù)據(jù)行為并采取相應(yīng)補(bǔ)救措施。 (六)安全的底線 依據(jù)《網(wǎng)絡(luò)安全法》第四十一條取得被收集者同意即自動(dòng)抓取個(gè)人信息,技術(shù)使用者即涉嫌構(gòu)成侵犯公民個(gè)人信息罪、非法侵入計(jì)算機(jī)信息系統(tǒng)罪或非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪等相關(guān)罪名。刑事案件中,往往沒(méi)有對(duì)數(shù)據(jù)的權(quán)屬進(jìn)行定性,而是更傾向于從行為和結(jié)果進(jìn)行定罪。 2021年2月,上海徐匯區(qū)檢察院通報(bào),某網(wǎng)絡(luò)公司在未經(jīng)被害公司授權(quán)許可的情況下,被告人李某決策通過(guò)非法手段抓取對(duì)方直播數(shù)據(jù)并出售牟利被提起公訴。2021年6月,河南省商丘市睢陽(yáng)區(qū)人民法院公布的刑事判決書(shū)【(2021)豫1403刑初78號(hào)】顯示,逯某和黎某兩男子通過(guò)自己開(kāi)發(fā)的爬蟲(chóng)軟件,對(duì)淘寶實(shí)施了長(zhǎng)達(dá)八個(gè)月的數(shù)據(jù)爬取,非法獲取近12億條用戶(hù)消息。 在“車(chē)來(lái)了”APP爬取“酷米客”APP公交車(chē)行駛實(shí)時(shí)數(shù)據(jù)案不正當(dāng)競(jìng)爭(zhēng)判決之前,南山區(qū)人民法院在刑事判決【(2017)粵0305刑初153號(hào)】中認(rèn)定,邵xx等五人的行為已構(gòu)成非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪,谷米公司因被非法侵入計(jì)算機(jī)信息系統(tǒng)所造成的直接經(jīng)濟(jì)損失為24.43萬(wàn)元。 在張xx等非法獲取計(jì)算機(jī)系統(tǒng)數(shù)據(jù)案【(2017)京 0108 刑初 2384 號(hào)】中 ,被告人張xx、宋x、侯xx作為被告單位上海晟品網(wǎng)絡(luò)科技有限公司主管人員,采用技術(shù)手段破解被害單位的防抓取措施,使用偽造device_id繞過(guò)服務(wù)器的身份校驗(yàn),使用偽造UA及IP繞過(guò)服務(wù)器的訪問(wèn)頻率限制,造成被害單位損失技術(shù)服務(wù)費(fèi)2萬(wàn)元,北京市海淀區(qū)人民法院以該行為侵入計(jì)算機(jī)系統(tǒng)的技術(shù)方式獲取服務(wù)器存儲(chǔ)數(shù)據(jù),構(gòu)成“非法獲取計(jì)算機(jī)系統(tǒng)數(shù)據(jù)罪”定罪。 (七)全鏈條的風(fēng)控 同樣還需要關(guān)注的是,數(shù)據(jù)資源一旦流通,原數(shù)據(jù)所有者就很難對(duì)其用途進(jìn)行追蹤、控制。例如,在“劍橋數(shù)據(jù)門(mén)”事件中,臉書(shū)對(duì)劍橋分析公司開(kāi)放了數(shù)據(jù),而后來(lái)劍橋分析公司用這些數(shù)據(jù)所做的事情引發(fā)了立法者和監(jiān)管機(jī)構(gòu)的審查。這也對(duì)Facebook造成了重大影響,隨后Facebook出于多種原因而暫時(shí)封禁數(shù)萬(wàn)個(gè)應(yīng)用。 也正是基于此,《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》對(duì)于數(shù)據(jù)合作中的數(shù)據(jù)處理活動(dòng)進(jìn)行監(jiān)督,關(guān)注全球化時(shí)代背景下數(shù)據(jù)全鏈條的安全。第十二條第一款第二項(xiàng)規(guī)定:(二)與數(shù)據(jù)接收方約定處理數(shù)據(jù)的目的、范圍、處理方式,數(shù)據(jù)安全保護(hù)措施等,通過(guò)合同等形式明確雙方的數(shù)據(jù)安全責(zé)任義務(wù),并對(duì)數(shù)據(jù)接收方的數(shù)據(jù)處理活動(dòng)進(jìn)行監(jiān)督。第二款規(guī)定:數(shù)據(jù)接收方應(yīng)當(dāng)履行約定的義務(wù),不得超出約定的目的、范圍、處理方式處理個(gè)人信息和重要數(shù)據(jù)。 由此可見(jiàn),第三方數(shù)據(jù)接收方首先必須合法獲取公開(kāi)數(shù)據(jù),其次,如果超過(guò)約定的目的、范圍、處理方式處理個(gè)人信息和重要數(shù)據(jù),仍然構(gòu)成違法。 數(shù)據(jù)相關(guān)案件不完全列表:2016年,“車(chē)來(lái)了”APP爬取“酷米客”APP公交車(chē)行駛實(shí)時(shí)數(shù)據(jù)案2017年,脈脈非法抓取使用新浪微博用戶(hù)信息案2017年,今日頭條未經(jīng)授權(quán)移植新浪微博大V賬號(hào)內(nèi)容數(shù)據(jù)案2019年,刷寶APP爬取抖音APP短視頻及用戶(hù)評(píng)論數(shù)據(jù)案2020年,北京朝陽(yáng):?jiǎn)T工通過(guò)“暗網(wǎng)”出售客戶(hù)信息案2021年,“極致了”網(wǎng)站爬取微信公眾號(hào)文章數(shù)據(jù)案2021年,魔蝎數(shù)據(jù)科技有限公司侵犯公民個(gè)人信息案2021年,上海浦東:公司非法爬取個(gè)人信息開(kāi)展征信業(yè)務(wù)出售牟利案2021年,斯氏(杭州)新媒體科技有限公司爬取微信公眾號(hào)平臺(tái)數(shù)據(jù)案(來(lái)源:獵云網(wǎng)) 免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。