首頁>熱點(diǎn) >
臥底“最全”大數(shù)據(jù)公司 淘寶、京東等多家網(wǎng)站數(shù)據(jù)被爬取 2019-08-20 09:20:42  來源:新京報(bào)

鄭州共贏科技公司內(nèi)景,業(yè)務(wù)員正在忙碌“殺單”。新京報(bào)記者 李大偉 攝

娛加科技大數(shù)據(jù)精準(zhǔn)營(yíng)銷系統(tǒng)頁面。

在“鷹眼智客”系統(tǒng)中,記者輸入關(guān)鍵詞“服裝”后采集到的信息,內(nèi)含手機(jī)號(hào)。

“不需要不需要,以后別再給我打電話了。”說完,代昌(化名)重重地將手機(jī)摔在了沙發(fā)上。代昌是河北邢臺(tái)清河縣一家民營(yíng)企業(yè)的實(shí)際控制人,最近幾年來,他接到的騷擾電話數(shù)量明顯增多。騷擾電話正成為大數(shù)據(jù)時(shí)代的“頑疾”。

記者調(diào)查發(fā)現(xiàn),一些所謂“大數(shù)據(jù)”公司數(shù)據(jù)來源可疑,甚至有些大數(shù)據(jù)公司并沒有數(shù)據(jù)。新京報(bào)記者經(jīng)過多地暗訪、臥底發(fā)現(xiàn),有大數(shù)據(jù)公司號(hào)稱可以采集到任意指定網(wǎng)站或者APP的訪客手機(jī)號(hào);另一家號(hào)稱“中國(guó)互聯(lián)網(wǎng)營(yíng)銷服務(wù)第一品牌”公司的“鷹眼智客”官網(wǎng)則顯示:“有你所需要的一切”。

7月底,新京報(bào)記者臥底“鷹眼智客”發(fā)現(xiàn),其實(shí)際上是利用爬蟲技術(shù),從淘寶、京東等網(wǎng)站上爬取到店家手機(jī)號(hào)后,用于營(yíng)銷。此外,借助該軟件,通過微信附近的人,用戶可任意設(shè)定虛擬位置后批量申請(qǐng)好友,還能“站街”釣魚營(yíng)銷。

有安全專家表示,當(dāng)用戶發(fā)生上網(wǎng)行為時(shí)會(huì)發(fā)送數(shù)據(jù)包,內(nèi)含行為痕跡、手機(jī)號(hào)等信息。一旦涉及某一方發(fā)生泄露,通過抓取這個(gè)數(shù)據(jù)包便可以解析出來用戶的敏感信息。網(wǎng)絡(luò)爬蟲則分為合法爬蟲和惡意爬蟲兩種。一些所謂的大數(shù)據(jù)公司本身沒有數(shù)據(jù)來源,而是通過爬蟲手段獲取他人的數(shù)據(jù)。

在網(wǎng)絡(luò)空間,數(shù)據(jù)戰(zhàn)場(chǎng)已進(jìn)入白熱化。2019年5月份,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)據(jù)安全管理辦法》征求意見稿第十五條也規(guī)定了,“網(wǎng)絡(luò)運(yùn)營(yíng)者以經(jīng)營(yíng)為目的收集重要數(shù)據(jù)或個(gè)人敏感信息的,應(yīng)向所在地網(wǎng)信部門備案。”此外,大多數(shù)網(wǎng)站早已對(duì)惡意爬蟲構(gòu)建反爬措施并作出聲明嚴(yán)厲禁止,有律師直言,“突破、繞開第三方平臺(tái)的反爬蟲策略、協(xié)議時(shí),或涉嫌非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪、提供侵入非法控制計(jì)算機(jī)信息系統(tǒng)程序工具罪。”

臥底“最全”大數(shù)據(jù)公司

淘寶、京東等多家網(wǎng)站數(shù)據(jù)被爬取

記者發(fā)現(xiàn)一家名為“鷹眼智客”的大數(shù)據(jù)公司號(hào)稱“中國(guó)互聯(lián)網(wǎng)營(yíng)銷服務(wù)第一品牌”。其官網(wǎng)宣稱:“有你所需要的一切”。據(jù)官網(wǎng)介紹,“鷹眼智客”歸屬于鄭州共贏科技有限公司。

7月29日,新京報(bào)記者來到該公司面試地點(diǎn)——鄭州市金水區(qū)金城國(guó)際廣場(chǎng)A座,通過面試得到試崗資格,主要工作是推銷一臺(tái)包含“鷹眼智客大數(shù)據(jù)營(yíng)銷系統(tǒng)”的電腦。在約一百平方米的房間里,充斥著啪啪啪敲擊鍵盤的聲音。房間內(nèi)的三十多名業(yè)務(wù)員共同組成了共贏科技的“商務(wù)部”。

據(jù)其官網(wǎng)顯示,“鷹眼智客”系統(tǒng)涵蓋QQ營(yíng)銷系列、微信營(yíng)銷系列、綜合采集系列、論壇貼吧系列、郵件營(yíng)銷系列五大模塊,擁有218個(gè)小功能。此外,其還宣傳稱“已成功為2800多家企業(yè)提供互聯(lián)網(wǎng)營(yíng)銷服務(wù),覆蓋120多個(gè)行業(yè)”。其中綜合采集系列號(hào)稱可精準(zhǔn)采集目標(biāo)客戶信息,覆蓋全網(wǎng)11大B2B平臺(tái),4大搜索引擎,7大地圖,準(zhǔn)確率達(dá)90%。

記者試崗期間任務(wù)是熟悉軟件流程,并得到主管發(fā)的一份“終端客戶聊天話術(shù)”。“終端客戶聊天話術(shù)”顯示,其數(shù)據(jù)來源于各大行業(yè)網(wǎng)站、各大平臺(tái)以及各大地圖等,“只要在網(wǎng)上公開留過痕跡的這些信息通過我們的核心技術(shù)SPILDER多線程技術(shù)都可以給你采集到。”

據(jù)極驗(yàn)產(chǎn)品總監(jiān)程柏(化名)介紹,其核心技術(shù)實(shí)際上是網(wǎng)絡(luò)爬蟲技術(shù)。據(jù)其介紹,目前互聯(lián)網(wǎng)流行的網(wǎng)絡(luò)爬蟲種類比較多,信息采集類的網(wǎng)絡(luò)爬蟲主要是腳本和模擬器類爬蟲。

記者發(fā)現(xiàn),“鷹眼智客精準(zhǔn)營(yíng)銷系統(tǒng)”共包含數(shù)據(jù)采集系列、QQ營(yíng)銷系列、社群論壇營(yíng)銷、綜合營(yíng)銷工具五個(gè)模塊,覆蓋了客戶數(shù)據(jù)采集到營(yíng)銷的整條產(chǎn)業(yè)鏈。

其中,數(shù)據(jù)采集系列模塊包含地圖行業(yè)采集、綜合數(shù)據(jù)采集、阿里巴巴采集、慧聰網(wǎng)采集、單頁名錄綜合采集、大眾點(diǎn)評(píng)網(wǎng)采集、淘寶商家信息采集、中國(guó)制造網(wǎng)采集、團(tuán)購?fù)赓u商家采集、阿里國(guó)際站采集、八方資源平臺(tái)采集、京東商家采集十二個(gè)功能。

記者測(cè)試發(fā)現(xiàn),該套軟件操作十分簡(jiǎn)單,每個(gè)功能還附有相應(yīng)的教學(xué)視頻來指導(dǎo)。7月30日,通過該軟件,記者成功獲取大量手機(jī)號(hào)。

以淘寶商家信息采集為例,記者在該系統(tǒng)中的淘寶商家采集功能中輸入關(guān)鍵詞“服裝”后,成功采集到北京地區(qū)淘寶賣家的82條信息,共耗時(shí)10分鐘。在軟件彈出框右下角還附有“導(dǎo)出電話鋪”的按鈕,采集得到的信息包括類型(店鋪等級(jí))、掌柜名稱、地區(qū)、電話、店址等多個(gè)維度。

此外,記者還對(duì)該系統(tǒng)的京東商家采集、地圖行業(yè)采集、阿里國(guó)際站采集等功能依次進(jìn)行測(cè)試,均獲成功。

附近的人有多近?

軟件任意定位,還可“站街”釣魚營(yíng)銷

“你得放開了玩,大聲喊出來!”在記者第一天早上上班之前,部門經(jīng)理將業(yè)務(wù)員分成兩支隊(duì)伍,輪番結(jié)對(duì)玩一種“美女與野獸”的游戲。據(jù)該公司的工作人員介紹,玩這種游戲是為了調(diào)動(dòng)業(yè)務(wù)員的積極性,培養(yǎng)團(tuán)隊(duì)榮譽(yù)感。

記者發(fā)現(xiàn)“鷹眼智客”自帶教學(xué)視頻,通過該視頻,記者試崗期間對(duì)工具中微信營(yíng)銷的八個(gè)功能逐個(gè)進(jìn)行測(cè)試。以該模塊中的微信定位營(yíng)銷功能為例,用戶使用該功能需用手機(jī)模擬器登錄微信。按照添加模式不同,該軟件分為添加附近的人、添加指定QQ、搖一搖、添加群成員四種。

記者調(diào)查發(fā)現(xiàn),點(diǎn)擊微信定位營(yíng)銷“獲取經(jīng)緯度坐標(biāo)”,會(huì)彈出一個(gè)頁面。假如在該彈出頁面輸入國(guó)貿(mào)位置后,用戶可將坐標(biāo)定位到國(guó)貿(mào),并看到國(guó)貿(mào)地區(qū)“附近的人”。利用該軟件用戶可以同時(shí)添加多個(gè)虛假位置,也支持多個(gè)微信號(hào)同時(shí)操作。

該套軟件還有一定的反封號(hào)機(jī)制。視頻教程顯示,在參數(shù)設(shè)置中,用戶可以自己選擇好友驗(yàn)證的次數(shù)、間隔時(shí)間以及每個(gè)位置發(fā)送驗(yàn)證申請(qǐng)的個(gè)數(shù)。“剛剛使用的話少添加一些,比如說添加五六個(gè),逐步增加,最多的話添加十個(gè)以內(nèi),有一段時(shí)間間隔之后再次添加。”

設(shè)置好位置及參數(shù)設(shè)定后,用戶可在軟件中“驗(yàn)證消息”下面的空白操作區(qū)域?qū)︱?yàn)證消息進(jìn)行編輯。“比如說,他是做生意的,你可以將驗(yàn)證消息編輯為‘你好,我想看下你產(chǎn)品’,這樣的話(驗(yàn)證申請(qǐng))通過率會(huì)更高一些。”

值得一提的是,該軟件還有一項(xiàng)名為“站街”的功能。所謂“站街”,即“如果說不想主動(dòng)添加好友,只想讓附近的人看到并添加你,就可以使用站街功能。”在位置一欄的彈出對(duì)話框中,用戶只需點(diǎn)擊“模擬器利用此位置站街”即可“站街”。

極驗(yàn)產(chǎn)品總監(jiān)程柏(化名)認(rèn)為,“鷹眼智客”部分功能屬于黑色產(chǎn)業(yè)鏈。“這類群發(fā)功能有些是違背用戶意愿的,純粹的牟利行為,像我有時(shí)候也會(huì)收到這類垃圾信息,多以營(yíng)銷為主,但是這類營(yíng)銷很多來源并不可靠,可能會(huì)有其他黑色產(chǎn)業(yè)鏈和惡意引導(dǎo)。”

新京報(bào)記者從“鷹眼智客”工作人員處了解到,公司為了方便客戶營(yíng)銷,還提供外呼機(jī)器人(AI電話)的服務(wù),只需要將采集到的電話號(hào)碼導(dǎo)入即可。

此前,新京報(bào)曾對(duì)外呼機(jī)器人進(jìn)行曝光。所謂外呼機(jī)器人,實(shí)際上是一條電話機(jī)器人系統(tǒng),一天客戶呼出1000通電話。隨后,央視3·15晚會(huì)也對(duì)外呼機(jī)器人進(jìn)行曝光,不法分子和違法科技公司通過探針盒子搜集用戶隱私、大數(shù)據(jù)提供支持、智能機(jī)器人提供外呼。

大數(shù)據(jù)如何“精準(zhǔn)營(yíng)銷”

抓取指定任意網(wǎng)站或APP的訪客手機(jī)號(hào)

新京報(bào)記者通過搜索關(guān)鍵詞“大數(shù)據(jù)精準(zhǔn)營(yíng)銷”,注意到一家名為娛加科技的大數(shù)據(jù)精準(zhǔn)營(yíng)銷公司。

企查查顯示,該公司全稱為蘇州娛加互娛網(wǎng)絡(luò)科技有限公司,法定代表人為吳輝。該公司成立于2018年4月19日,注冊(cè)資本200萬元人民幣,所屬行業(yè)為軟件和信息技術(shù)服務(wù)業(yè)。

8月19日下午,新京報(bào)記者以保健品和網(wǎng)貸銷售的身份與吳輝取得聯(lián)系。對(duì)某些行業(yè)數(shù)據(jù),吳輝顯得謹(jǐn)小慎微。“保健品暫時(shí)不行,保健品目前查得比較嚴(yán),屬于高危敏感行業(yè)。”吳輝告訴新京報(bào)記者說。

據(jù)其介紹,該公司的獲客系統(tǒng)十分精準(zhǔn)。“你可以指定任意網(wǎng)站或者APP,只需要提供網(wǎng)站鏈接或者APP的名稱及下載鏈接,我們就可以抓取到訪客的手機(jī)號(hào)碼。”吳輝說。

不過,其所提供的訪客的手機(jī)號(hào)碼只顯示真實(shí)的前三位以及后四位,所以只能通過他們提供的系統(tǒng)去進(jìn)行營(yíng)銷。“我們會(huì)提供一個(gè)外呼系統(tǒng),可以將這些手機(jī)號(hào)提供到外呼系統(tǒng)里面去和客戶溝通。”吳輝介紹。獲取的中間四位被隱藏的手機(jī)號(hào)也被其稱為“脫敏數(shù)據(jù)”。

此外,訪客獲取到的手機(jī)號(hào)也存在一定限制。“現(xiàn)在運(yùn)營(yíng)商主要做的是聯(lián)通和電信的,移動(dòng)的停掉了。”吳輝說。至于為何停掉移動(dòng)的,對(duì)方給出的答案則是因?yàn)?ldquo;移動(dòng)用戶太龐大了”。

除了運(yùn)營(yíng)商,吳輝還表示,如果用戶是通過WiFi或者電腦來訪問的,也無法抓取到手機(jī)號(hào)。“它(該系統(tǒng))是通過流量來訪問的,電腦端和無線網(wǎng)是抓取不了的,必須通過手機(jī)通信網(wǎng)絡(luò)。”

為了增強(qiáng)說服力,吳輝建議記者“可以先花五百測(cè)試一下”。據(jù)其介紹,使用套餐為1000條起測(cè),“我們可以簽一個(gè)費(fèi)用套餐,開一個(gè)坐席,你自己去測(cè)試一下轉(zhuǎn)化率是多少。”

吳輝提供給記者一份公司介紹。介紹文件對(duì)娛加科技獲客系統(tǒng)與普通網(wǎng)頁手機(jī)號(hào)抓取軟件做了對(duì)比,對(duì)比圖顯示,網(wǎng)頁手機(jī)訪客抓取軟件犯法,而娛加科技獲客系統(tǒng)則為“聯(lián)合聯(lián)通電信運(yùn)營(yíng)商正式推出的產(chǎn)品,合法合規(guī),穩(wěn)定安全”。

8月19日,該公司倚為背書的聯(lián)通和電信的客服分別對(duì)此事進(jìn)行否認(rèn),稱“并未提供過這種服務(wù)”。

在介紹文件中,該公司提供給某整形美容醫(yī)院的服務(wù)也被做成了一份案例。案例顯示,該整形醫(yī)院以整形醫(yī)院哪家好、玻尿酸墊下巴、昆明隆鼻、整形醫(yī)院、美容醫(yī)院等225個(gè)關(guān)鍵詞,提交了本地同行等23個(gè)推廣網(wǎng)址、31個(gè)同行座機(jī)咨詢電話以及兩款醫(yī)美類APP,要求目標(biāo)客戶為來自上海、年齡在16至50歲之間的女性客戶。

該公司文件顯示,在2019年3月,每日推送100條左右的數(shù)據(jù),共推送3053條。其中接通1872個(gè),意向客戶873個(gè),轉(zhuǎn)化客戶372個(gè)。接通率為61.31%,意向率為28.59%,轉(zhuǎn)化率為12.18%,獲客成本只有百度競(jìng)價(jià)推廣的六分之一。

安全研究員Jane介紹,當(dāng)用戶發(fā)生上網(wǎng)行為時(shí),首先向運(yùn)營(yíng)商發(fā)送一個(gè)數(shù)據(jù)包。該數(shù)據(jù)包經(jīng)過運(yùn)營(yíng)商之后再傳給服務(wù)商。數(shù)據(jù)包中包含有用戶的上網(wǎng)痕跡、手機(jī)號(hào)等信息。“當(dāng)其中某一方發(fā)生信息泄露時(shí),不法分子可以利用這個(gè)數(shù)據(jù)包解析出來用戶的敏感信息。”Jane告訴新京報(bào)記者。

充滿技巧的“殺單”話術(shù)

有業(yè)務(wù)員日賺近5000元

“公司目前有兩種計(jì)酬方式,一種是有底薪制,底薪為1500,銷售一件產(chǎn)品提成為10%;另一種為無底薪制,底薪為0,銷售一件產(chǎn)品提成為25%。”共贏科技負(fù)責(zé)面試的李夢(mèng)海(化名)告訴新京報(bào)記者,“一般人都會(huì)選擇無底薪高提成的,賺得多。”一臺(tái)包含“鷹眼智客大數(shù)據(jù)營(yíng)銷系統(tǒng)”的電腦,定價(jià)為8800元。按照定價(jià)以及提成來推算,每銷售一臺(tái),業(yè)務(wù)員可以得到2200元。

據(jù)李夢(mèng)海介紹,共贏科技有限公司在鄭州總部共有5個(gè)小隊(duì)。記者被分配到“尖刀隊(duì)”。

“恭喜尖刀隊(duì)甜甜出單!”7月31日下午3點(diǎn)50分,坐在記者右側(cè)的甜甜突然喊道。當(dāng)業(yè)務(wù)員出單時(shí),便會(huì)自己喊出“恭喜××隊(duì)××出單!”,此刻所有人便會(huì)停下案頭工作為其鼓掌。“這是一種獎(jiǎng)勵(lì)機(jī)制。”一名工作人員向新京報(bào)記者介紹說。

甜甜是一名新人。1992年出生的她,幾個(gè)月前來到這個(gè)公司轉(zhuǎn)行成為一名銷售。因剛?cè)胄胁痪茫恍?ldquo;殺單”的話術(shù)她并不熟練,當(dāng)客戶表現(xiàn)得意向較強(qiáng)時(shí),較為資深的業(yè)務(wù)員便會(huì)聚攏過來進(jìn)行指導(dǎo)。據(jù)其描述,她平均每月可以成交四五單。在鄭州來講,收入十分可觀。

所謂“殺單”,則是銷售之間常見的行話,意為和客戶成交。甜甜出單后不久,坐在記者斜對(duì)面的“馬總”(昵稱)也出了一單。

“這已經(jīng)是他今天出的第二單。按照每單提成25%的利潤(rùn)來計(jì)算的話,算上獎(jiǎng)金,他已經(jīng)賺了快5000塊錢了。”甜甜說。

這種場(chǎng)景在記者試崗期間頻繁出現(xiàn)。在尖刀隊(duì)主管楊小峰(化名)發(fā)送給記者的一份“終端客戶聊天話術(shù)”文檔中,詳細(xì)地記載了一些“殺單”技巧以及問答實(shí)錄。記者發(fā)現(xiàn),當(dāng)新人有客戶意向較為強(qiáng)烈時(shí),經(jīng)理和團(tuán)隊(duì)主管便會(huì)聚攏上來出謀劃策,研究如何讓顧客上鉤。

據(jù)甜甜透露,她“殺”的客戶是一位“做保健品的”。8月18日,記者聯(lián)系到甜甜這位客戶張娜(化名)。據(jù)其介紹,在使用“鷹眼智客”系統(tǒng)僅僅兩天后,她使用多年的微信號(hào)即遭到封禁。張娜說她再也不敢用了。

合法爬蟲or惡意爬蟲

惡意爬蟲涉非法獲取計(jì)算機(jī)系統(tǒng)數(shù)據(jù)罪

“這肯定是合規(guī)的,因?yàn)槲覀儾恢苯訁⑴c販賣數(shù)據(jù)。”該公司負(fù)責(zé)人事的李夢(mèng)海告訴新京報(bào)記者說,“如果賣爬取到的數(shù)據(jù)就違法了。”

該公司的業(yè)務(wù)員王偉(化名)則給出了不同的答案。王偉向新京報(bào)記者直言了自己的擔(dān)憂。“外呼機(jī)器人是違規(guī)的,之前曾被曝光過。”王偉說。

爬蟲技術(shù)是為了互聯(lián)網(wǎng)本身信息傳播而產(chǎn)生的。通過網(wǎng)絡(luò)爬蟲,搜索引擎獲悉互聯(lián)網(wǎng)的內(nèi)容。在網(wǎng)絡(luò)安全領(lǐng)域,也有通過爬蟲來檢測(cè)網(wǎng)站漏洞和網(wǎng)站可用性。

“爬蟲技術(shù)的本質(zhì)用途仍然存在,像百度、谷歌之類的公司,但是互聯(lián)網(wǎng)上面的其他黑產(chǎn)眼里只有利益,他們通過網(wǎng)絡(luò)爬蟲做二次數(shù)據(jù)封裝和用戶引流,通過數(shù)據(jù)販賣和流量牽引牟利。從用戶視角來說,危害主要有惡意營(yíng)銷、網(wǎng)絡(luò)攻擊(網(wǎng)絡(luò)釣魚);從網(wǎng)站角度來說,危害包括網(wǎng)絡(luò)攻擊、薅羊毛、影響正常的企業(yè)服務(wù)、信息價(jià)值流失、用戶流失。”程柏說。

中消協(xié)此前發(fā)布的《APP個(gè)人信息泄露情況調(diào)查報(bào)告》顯示,約86.5%的受訪者曾受到推銷電話或短信的騷擾,約75.0%的受訪者接到詐騙電話,約63.4%的受訪者收到垃圾郵件,排名位居前三位。

對(duì)于此類爬蟲軟件,多數(shù)網(wǎng)站早已聲明嚴(yán)厲禁止。北京煒衡律師事務(wù)所周浩律師認(rèn)為,“網(wǎng)絡(luò)爬蟲爬取數(shù)據(jù)需要遵守第三方平臺(tái)的Robots協(xié)議以及獲取數(shù)據(jù)的性質(zhì)具有公開性,不得包含個(gè)人信息數(shù)據(jù)、商業(yè)秘密及國(guó)家秘密等信息數(shù)據(jù)。如果突破、繞開第三方平臺(tái)的反爬蟲策略、協(xié)議時(shí),或涉嫌非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪、提供侵入非法控制計(jì)算機(jī)信息系統(tǒng)程序工具罪。”

Robots協(xié)議也稱為爬蟲協(xié)議、機(jī)器人協(xié)議等,其全稱為“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)(Robots Exclusion Protocol)”。

“網(wǎng)站通過Robots協(xié)議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。對(duì)于搜索引擎來說是行業(yè)通用的爬取約定協(xié)議,但對(duì)惡意爬蟲來說并沒有任何約束力。”知道創(chuàng)宇技術(shù)總監(jiān)鄧金城告訴新京報(bào)記者說。

據(jù)騰訊發(fā)布的《2018上半年安全專題系列研究報(bào)告》(以下簡(jiǎn)稱報(bào)告)顯示,惡意爬蟲通過分析并自行構(gòu)造參數(shù)對(duì)非公開接口進(jìn)行數(shù)據(jù)爬取或提交,獲取對(duì)方本不愿意被大量獲取的數(shù)據(jù)。

報(bào)告指出,據(jù)統(tǒng)計(jì),出行、社交、電商占惡意爬蟲流量目標(biāo)行業(yè)分布前三位,占比分別為20.87%、18.40%、13.38%。

周浩表示,《網(wǎng)絡(luò)安全法》《個(gè)人信息安全規(guī)范》都強(qiáng)調(diào)了,通信聯(lián)系方式(電話號(hào)碼)是重要的個(gè)人信息,非經(jīng)同意不得收集。提供用來收集個(gè)人信息的工具,一旦被使用必然存在違規(guī)。

技術(shù)發(fā)展倒逼法律完善

收集重要數(shù)據(jù)或個(gè)人敏感數(shù)據(jù)需備案

溯其本源,便是逐利。

“一些所謂的大數(shù)據(jù)公司本身沒有數(shù)據(jù)來源,而是通過爬蟲手段獲取他人的數(shù)據(jù)。”程柏說。

反爬斗爭(zhēng)已悄然進(jìn)入白熱化。不過,“反爬”絕非易事。知道創(chuàng)宇404實(shí)驗(yàn)室副總監(jiān)隋剛介紹,規(guī)模較大的公司都會(huì)有自己的反爬機(jī)制,但“有些爬蟲可以繞過這些反爬機(jī)制”。

技術(shù)的不斷發(fā)展在倒逼相關(guān)法律趨于完善。2019年5月份,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《數(shù)據(jù)安全管理辦法》征求意見稿(以下簡(jiǎn)稱“征求意見稿”)對(duì)爬蟲技術(shù)有明確的定義和規(guī)定。其中第十六條規(guī)定,網(wǎng)絡(luò)運(yùn)營(yíng)者采取自動(dòng)化手段訪問收集網(wǎng)站數(shù)據(jù),不得妨礙網(wǎng)站正常運(yùn)行;如自動(dòng)化訪問收集流量超過網(wǎng)站日均流量三分之一,網(wǎng)站要求停止自動(dòng)化訪問收集時(shí),應(yīng)當(dāng)停止。

“不過,第十六條在實(shí)踐操作中可能存在一定問題,對(duì)造成網(wǎng)絡(luò)不能正常運(yùn)行也未有相應(yīng)的處罰措施,這可能是將來需要完善的地方。”曾多次參與制定企業(yè)隱私政策的京師上海國(guó)際總部專職律師徐延軒說。

同時(shí)征求意見稿第十五條也規(guī)定了,“網(wǎng)絡(luò)運(yùn)營(yíng)者以經(jīng)營(yíng)為目的收集重要數(shù)據(jù)或個(gè)人敏感信息的,應(yīng)向所在地網(wǎng)信部門備案。”徐延軒認(rèn)為,收集重要數(shù)據(jù)備案制度可能是未來監(jiān)管的方向。

關(guān)鍵詞: 網(wǎng)站數(shù)據(jù) 爬取

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片