我們一切通訊和互聯(lián)網(wǎng)應(yīng)用都建立在通訊網(wǎng)絡(luò)上。所以三大運(yùn)營商-電信,移動(dòng),聯(lián)通能夠接觸到全部中國互聯(lián)網(wǎng)的流量數(shù)據(jù),這話不假。
我們先從技術(shù)上看看運(yùn)營商的數(shù)據(jù)是如何獲取的,都有哪些類型。
前面說過,所有互聯(lián)網(wǎng)應(yīng)用數(shù)據(jù)都要經(jīng)過通訊設(shè)備傳輸。有線和無線的數(shù)據(jù)終端產(chǎn)生的數(shù)據(jù),最終匯集到有線骨干網(wǎng)絡(luò),再通過路由器向相應(yīng)目的地分發(fā)。固網(wǎng)流量數(shù)據(jù)有2種獲得方式:
1.直接分光,可以得到99.99%的流量數(shù)據(jù);
2.端口鏡像,主要是80,8080這兩個(gè)http協(xié)議常用端口。移動(dòng)流量數(shù)據(jù)獲取要復(fù)雜一些,涉及不同運(yùn)營商蜂窩網(wǎng)絡(luò)標(biāo)準(zhǔn),主要對(duì)接GPRS,CDMA,LTE網(wǎng)絡(luò)端口來獲取。
運(yùn)營商都有自己的數(shù)據(jù)平臺(tái),數(shù)據(jù)處理主要采用DPI-Deep Package Inspection 深度數(shù)據(jù)報(bào)文解析技術(shù)-所謂“深度”是和普通的報(bào)文解析層次比較而言的,“普通報(bào)文檢測”僅分析IP包的4層以下的內(nèi)容,包括源地址、目的地址、源端口、目的端口以及協(xié)議類型,而DPI 除了對(duì)前面的層次分析外,還增加了應(yīng)用層分析,識(shí)別各種應(yīng)用及其內(nèi)容。對(duì)應(yīng)用層的識(shí)別依賴于對(duì)市場活躍流量對(duì)應(yīng)的業(yè)務(wù)和供應(yīng)廠商的持續(xù)跟蹤和更新。
另外一個(gè)數(shù)據(jù)采集方式是通過日志溯源系統(tǒng),日志溯源系統(tǒng)3大運(yùn)營商有自己的格式,數(shù)據(jù)和日志的join工作也已經(jīng)完成,一般采用流日志的格式,以文件形式保存,不能夠做到實(shí)時(shí)。
運(yùn)營商數(shù)據(jù)平臺(tái)主要采集的是用戶上行流量-即用戶向網(wǎng)絡(luò)主動(dòng)發(fā)送請(qǐng)求的數(shù)據(jù)。此外移動(dòng)網(wǎng)絡(luò)中還有基站信令數(shù)據(jù),用于維護(hù)用戶設(shè)備與網(wǎng)絡(luò)鏈路的鏈接,不受用戶控制,隨時(shí)隨地的發(fā)生。這部分?jǐn)?shù)據(jù)也有很大商業(yè)價(jià)值,比如LBS信息,但因?yàn)閿?shù)據(jù)歸屬部門不同,一般不納入運(yùn)營商的數(shù)據(jù)采集體系。
運(yùn)營商數(shù)據(jù)解析有很多技術(shù)障礙需要克服,比如NAT問題,在IPv4向IPv6過渡過程中,為提高IP地址復(fù)用率造成的用戶識(shí)別困難數(shù)據(jù)分片造成的數(shù)據(jù)完整性問題;還有數(shù)據(jù)緩存清洗問題,https加密問題等等。
因此,在了解了運(yùn)營商數(shù)據(jù)產(chǎn)生傳輸機(jī)制后,運(yùn)營商為大數(shù)據(jù)應(yīng)用而建立的數(shù)據(jù)平臺(tái),并沒有外界看起來的那么順手和輕松。
打個(gè)比方,運(yùn)營商視角網(wǎng)絡(luò)上的數(shù)據(jù)好比由無數(shù)條不同材質(zhì),形狀,顏色的珠子串成的項(xiàng)鏈,被拆散混在一起,還夾雜著各種連接件一股腦的丟進(jìn)管道網(wǎng)絡(luò)里,奔向不同的目的地。你觀察管道川流不息的珠子流,想重新還原出一個(gè)完整項(xiàng)鏈的樣子...
談何容易。
下面我們談?wù)勥\(yùn)營商數(shù)據(jù)適合的應(yīng)用場景。
對(duì)于單個(gè)用戶而言,他至少是依賴某一個(gè)運(yùn)營商來進(jìn)行網(wǎng)絡(luò)通信,因此如果以國家安全的名義,技術(shù)上是可以追溯這個(gè)用戶的全部網(wǎng)絡(luò)行為數(shù)據(jù)的(日志回溯系統(tǒng)為此而建立),從而對(duì)用戶進(jìn)行精準(zhǔn)畫像。
但是針對(duì)某一個(gè)市場,省份的用戶群,畢竟我們有3個(gè)運(yùn)營商,沒有哪一個(gè)運(yùn)營商擁有全部數(shù)據(jù)。不過每一個(gè)運(yùn)營商的數(shù)據(jù)在市場上是垂直分布的,體量也足夠大,因此樣本覆蓋是很全的,所以很適合做統(tǒng)計(jì)分析和洞察。整個(gè)市場好比是一塊大蛋糕,每個(gè)運(yùn)營商都自上而下的切了一塊,你看看切面就知道蛋糕的配料組成和分布了。
至于大多廣告主希望的針對(duì)個(gè)人用戶的重定向,精準(zhǔn)營銷,運(yùn)營商數(shù)據(jù)技術(shù)上可以做,但是實(shí)際上很難操作。因?yàn)閿?shù)據(jù)安全敏感性原因。運(yùn)營商所有數(shù)據(jù)都有一個(gè)宗旨:“不出網(wǎng)”,這個(gè)不出網(wǎng)的概念是不能對(duì)接到運(yùn)營商機(jī)房以外的任何系統(tǒng)里。運(yùn)營商不敢為了數(shù)據(jù)應(yīng)用這點(diǎn)芝麻利益,觸碰用戶隱私法律邊界。
綜上所述,運(yùn)營商數(shù)據(jù)適合做金融征信,但需要脫敏處理;適合統(tǒng)計(jì)分析和市場洞察。
運(yùn)營商的數(shù)據(jù)一直被營銷業(yè)界視為無可替代的寶貴資源,千方百計(jì)想要合作應(yīng)用。
但大家往往忽略的是:數(shù)據(jù)不是電信運(yùn)營商的核心資產(chǎn),數(shù)據(jù)應(yīng)用也不是他們的核心業(yè)務(wù),與收入來源。
運(yùn)營商網(wǎng)絡(luò)關(guān)注點(diǎn)在于大覆蓋,高速率,和低延時(shí)。吸引更多的入網(wǎng)用戶賺取服務(wù)費(fèi)是他們的業(yè)務(wù)核心。
我國的運(yùn)營商是國營企業(yè),面臨直接的政府監(jiān)管。雖然在大數(shù)據(jù)時(shí)代,運(yùn)營商也變相推出一些數(shù)據(jù)產(chǎn)品,但都非常謹(jǐn)慎,經(jīng)濟(jì)上不會(huì)為了數(shù)據(jù)里的芝麻,丟了數(shù)百億的運(yùn)營收入的大西瓜。所以,運(yùn)營商的數(shù)據(jù)應(yīng)用,面臨很多業(yè)務(wù)上的限制,也面臨很多技術(shù)上的壁壘,這一點(diǎn)往往是外部沒有想到的。
希望這一小段文字,能夠幫助大家更好的理解運(yùn)營商數(shù)據(jù)問題。
網(wǎng)站標(biāo)題:運(yùn)營商數(shù)據(jù)是如何獲取的,有哪些合適的應(yīng)用場景?
鏈接分享:http://jinyejixie.com/news3/191853.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站導(dǎo)航、微信公眾號(hào)、品牌網(wǎng)站制作、軟件開發(fā)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)