2021-02-04 分類: 網(wǎng)站建設(shè)
技術(shù)領(lǐng)導(dǎo)力社區(qū)來源:
警方發(fā)現(xiàn),在廣州諾涵科技公司,公民個人信息被稱為“流量”,公司自己開發(fā)有“樂花管家”等多個小貸平臺,在自身購買公民個人信息用于推銷貸款、軟暴力催收的同時,也和其他公司相互交換公民個人信息,還開發(fā)有爬蟲云等軟件,通過技術(shù)手段爬取其他小貸公司的公民個人信息,用于公司放貸和非法出售牟利。
鎖定相關(guān)犯罪證據(jù)后,淮安警方在長沙、深圳分別將湖南九象公司的法定代表人和技術(shù)主管抓獲。
審訊得知,九象公司黑爬蟲網(wǎng)站的“身份核驗返照”業(yè)務(wù)端口來自北京黑格科技有限公司,而黑格公司是從北京考拉征信服務(wù)有限公司等四家公司購買的查詢接口。
隨即,警方將北京黑格公司和考拉征信服務(wù)有限公司的法定代表人、董事長、銷售、技術(shù)等 20 余名涉案人員抓獲,并于今年 4 月在北京將他們上游公司的 5 名涉案人員抓獲。
經(jīng)查,北京考拉征信服務(wù)有限公司從上游公司獲取接口后又違規(guī)將查詢接口出賣,并非法緩存公民個人身份信息,供下游公司查詢牟利,從而造成公民身份信息包括身份證照片的大量泄露。
違規(guī)緩存相當(dāng)于把公民個人信息復(fù)制了一份,存在那邊,下游公司再向它通過數(shù)據(jù)接口調(diào)取數(shù)據(jù)的時候,它就不需要再向上游調(diào)取,也是節(jié)省了開支,這個是違法的。
(圖片文字來自新浪網(wǎng))
案例三:用爬蟲技術(shù)擾亂對方網(wǎng)站經(jīng)營規(guī)則,且牟利。比如這個:
(圖片文字來自中國永嘉公號)
圖上描述做搜索引擎排名的技術(shù),其實就是利用爬蟲技術(shù)規(guī)模化的訪問網(wǎng)頁。
在我們通常的認(rèn)知里,因為互聯(lián)網(wǎng)推崇分享精神,所以認(rèn)為只要是網(wǎng)絡(luò)公開數(shù)據(jù)就可以抓取,但是通過上面的案例來看,有幾個禁忌,抓取的數(shù)據(jù)最好不要直接商用,涉及社交信息/用戶信息要謹(jǐn)慎。
老板交代你抓取敏感任務(wù)時,讓老板先看下刑法第285條。公司從事違法業(yè)務(wù),不代表個人行為就沒事,只是還沒入有關(guān)部門的法眼。
爬哪些數(shù)據(jù)會觸犯法律?
第一、著作權(quán)法保護(hù)的所有作品數(shù)據(jù)
比如一些網(wǎng)站發(fā)表的內(nèi)容,如文章、評論等都是有著作權(quán)的,如果只是單純的通過瀏覽器查看是不會觸犯法律的。
但是,對于有著作權(quán)的作品,如果未經(jīng)著作權(quán)人許可,以盈利為目的,對其作品用任何手段進(jìn)行復(fù)制是犯法的。
如果是使用了爬蟲技術(shù)手段爬取數(shù)據(jù)之后將其保存下來或者傳播,并且進(jìn)行盈利,這種都是屬于犯罪的。
第二、網(wǎng)站用戶的個人信息或者隱私信息
網(wǎng)站上的個人用戶的個人信息,即使是用戶自己放到一些網(wǎng)站上進(jìn)行公開或者部分公開,如微博、微信等,不代表這些數(shù)據(jù)就可以被其他人隨便獲取,這個要特別注意。
所以,如果爬取的數(shù)據(jù)涉及到個人信息或隱私信息,都是違法的!
還有些爬蟲企圖繞過權(quán)限校驗等,爬取用戶未公開的信息,如個人私密相冊照片等,都是屬于侵犯用戶的個人隱私的,不要覺得自己技術(shù)玩得溜,這些可都是違法行為。
第三、反不正當(dāng)競爭法中明確保護(hù)的數(shù)據(jù)
許多網(wǎng)站中的數(shù)據(jù)系由用戶生成,且該等數(shù)據(jù)和內(nèi)容系原告網(wǎng)站的主要競爭力來源。如“XX點評”、“X團”上面的店鋪評價、評論等信息,“X程網(wǎng)”上面的關(guān)于酒店的評價評論等信息等。
那么,未經(jīng)允許,爬取其他網(wǎng)站的核心數(shù)據(jù),很明顯并沒有遵守《反不正當(dāng)競爭法》中規(guī)定的自愿、平等、公平、誠實信用的原則。
在“XX點評”訴“X度”不正當(dāng)競爭案件、以及“X浪微博”訴“X脈脈”不正當(dāng)競爭等案件中,法院都認(rèn)定被告未經(jīng)許可抓取、使用原告網(wǎng)站中的數(shù)據(jù)的行為,違反了誠實信用原則及公認(rèn)的道德,損害了互聯(lián)網(wǎng)的市場競爭秩序,損害了原告的競爭優(yōu)勢,從而構(gòu)成不正當(dāng)競爭。
因此,如果抓取XX點評、X博、X瓣電影、X乎等UGC模式的網(wǎng)站上用戶發(fā)布的信息,并在自己的產(chǎn)品或者服務(wù)中發(fā)布、使用該等信息,則有較大的風(fēng)險構(gòu)成不正當(dāng)競爭。
怎么爬數(shù)據(jù)算犯法?
如果是爬取公開的數(shù)據(jù),通常不會被認(rèn)為是侵權(quán)。Google、百度等搜索引擎都是這么爬取的。
那么,到底怎么爬數(shù)據(jù)是有可能觸犯法律的呢,主要考慮是否涉及以下兩種行為:
沒有遵守網(wǎng)站Robots協(xié)議
Robots協(xié)議是技術(shù)界為了解決爬取方和被爬取方之間通過計算機程序完成關(guān)于爬取的意愿溝通而產(chǎn)生的一種機制。
通過技術(shù)手段,繞過防護(hù)措施,抓取數(shù)據(jù)
由于爬蟲的批量訪問會給網(wǎng)站帶來巨大的壓力和負(fù)擔(dān),因此許多網(wǎng)站經(jīng)營者會采取技術(shù)手段,以阻止爬蟲批量獲取自己網(wǎng)站信息。
所以,很多爬蟲工具為了爬取數(shù)據(jù),會想辦法通過各種手段繞過防護(hù)措施,但是,這種行為也是會觸犯法律的。
抓回來的數(shù)據(jù)怎么用會犯法?
很多公司開發(fā)的爬蟲遵守了Robots協(xié)議,也沒有爬取不該爬取的數(shù)據(jù),難道這樣獲取到的數(shù)據(jù)就可以隨便使用了嗎?其實也不是,如果使用不當(dāng),也會觸犯法律的。
比如通過爬蟲抓取到的數(shù)據(jù)進(jìn)行盈利、損害他人利益、造假、誹謗等都是可能觸犯法律的。
此外,未經(jīng)被收集者同意,即使是將合法收集的公民個人信息向他人提供的,也屬于刑法第二百五十三條之一規(guī)定的“提供公民個人信息”,可能構(gòu)成犯罪。
在科技飛速發(fā)展的今天,人們開始追求各種方便快捷的方式生活,但是,在方便快捷的背后,個人信息安全也不能忽視。瀏覽器、社交平臺等等都有可能出現(xiàn)隱私泄露。
個人隱私泄露有著很嚴(yán)重的安全隱患!如何防止個人信息泄露?快來看防范小妙招:
當(dāng)前題目:大數(shù)據(jù)公司又被查,爬蟲程序員在內(nèi)20余人被抓!
網(wǎng)頁URL:http://jinyejixie.com/news32/99182.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計、服務(wù)器托管、全網(wǎng)營銷推廣、網(wǎng)站導(dǎo)航、企業(yè)建站、網(wǎng)站收錄
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容