2021-12-16 分類: 網(wǎng)站建設(shè)
因?yàn)樵诙宋绻?jié)前。筆者做過一個(gè)實(shí)驗(yàn),并且寫了一篇實(shí)驗(yàn)報(bào)告《探究搜索引擎不收錄網(wǎng)站內(nèi)容與外鏈因素有無關(guān)系的實(shí)驗(yàn)》,具體實(shí)驗(yàn)內(nèi)容,在這里就不再多說。因?yàn)楣P者針對(duì)leyuanbaby.com做的這個(gè)實(shí)驗(yàn)結(jié)論,并沒有達(dá)到想要的效果,所以我還沒有死心,就通過網(wǎng)站日志來觀察到底蜘蛛有沒有爬行我未收錄的鏈接。這個(gè)過程中,獲得了一些關(guān)于分析網(wǎng)站日志心得,在這里分享給大家。
通過網(wǎng)站日志我們可以清晰的看到用戶和搜索引擎蜘蛛訪問網(wǎng)站的行為,并形成一個(gè)數(shù)據(jù),這些數(shù)據(jù)可以讓我們知道搜索引擎對(duì)于網(wǎng)站的態(tài)度,以及網(wǎng)站的健康情況。通過網(wǎng)站日志我們獲取的指標(biāo)有很多,比如:訪問次數(shù)、停留時(shí)間、抓取量、目錄抓取統(tǒng)計(jì)、頁面抓取統(tǒng)計(jì)、蜘蛛訪問IP、HTTP狀態(tài)碼、蜘蛛活躍時(shí)段、蜘蛛爬取路徑等。
那么下面就通過實(shí)例來看看,網(wǎng)站日志是如何分析的:
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2013-05-27 16:44:28
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-agent) sc-status sc- substatus sc-win32-status
2013-05-27 16:44:27 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 123.125.71.84 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64
2013-05-27 16:45:15 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 220.181.108.176 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64
上面是我的站點(diǎn)leyuanbaby.com的5月27的網(wǎng)站日志情況,我們就根據(jù)以上的一段日志來分析,如何查看網(wǎng)站日志。
1.首先我們看到Software,這是指軟件的名稱,version表示的是軟件的版本號(hào),這兩項(xiàng)就不再多說。
2.Date表示的是訪問日期,即百度蜘蛛是什么時(shí)間來爬行的你的站點(diǎn)。
3. s-sitename:表示你的虛擬主機(jī)的代稱或機(jī)器碼;
4.s-ip:服務(wù)器IP;
5.cs-method:表示訪問方法或發(fā)生的請(qǐng)求/提交事件,常見的有兩種:一個(gè)是GET,就是平常我們打開一個(gè)URL訪問的動(dòng)作,另一個(gè)是POST,提交表單時(shí)的動(dòng)作;
6.cs-uri-stem:用戶在當(dāng)前時(shí)間訪問哪一個(gè)文件或具體頁面;
7.cs-uri-query:是指訪問地址的附帶參數(shù),如asp文件后面的字符串id=12等等,如果沒有參數(shù)則用“-”表示;
8.s-port:訪問的端口
9.cs-username:訪問者名稱,如果沒有參數(shù)則用“-”表示;
10.c-ip:訪問者IP
11.cs(User-agent):訪問的搜索引擎和蜘蛛名稱;
12.sc-status:Http狀態(tài)碼,200表示成功,403表示沒有權(quán)限,404表示打不到該頁面,500表示程序有錯(cuò);
通過上面的實(shí)例,我們已經(jīng)知道了分析網(wǎng)站日志要看的各項(xiàng)數(shù)據(jù),那么我們分析網(wǎng)站日志能給我們帶來什么作用和提示呢筆者認(rèn)為,網(wǎng)站日志可以給我們帶來6項(xiàng)提示:
1.清晰明了的知道百度蜘蛛抓取網(wǎng)頁的情況。
2.根據(jù)蜘蛛的爬行情況,我們可以看出搜索引擎收錄網(wǎng)頁的原則。
3.搜索引擎蜘蛛爬行站點(diǎn)是否正常,從而明白網(wǎng)站優(yōu)化手段是否健康。
4.搜索引擎蜘蛛在哪個(gè)頁面爬行最多,為什么喜歡這一頁面,是否其他頁面要向此頁面學(xué)習(xí)。
5.搜索引擎蜘蛛很少訪問的頁面帶給我們的提示是,這個(gè)頁面可能存在一些搜索引擎不喜愛的東西,我們要去總結(jié)修改。
6.我們卸載robotS中的內(nèi)容,搜索引擎有無訪問
同時(shí)我們需要特別注意的是Http狀態(tài)碼,通過狀態(tài)碼,我們可以更明確的知道,這一頁面存在什么樣的問題,蜘蛛是如何評(píng)判的。Http狀態(tài)碼有很多,是每一位站長(zhǎng)需要掌握和熟記的,在這里就不做多解釋。
網(wǎng)站的健康分析、蜘蛛爬行規(guī)則等均是通過網(wǎng)站日志來觀察,可以說網(wǎng)站日志就是蜘蛛和站長(zhǎng)們交流的一種方式,學(xué)會(huì)看網(wǎng)站日志,對(duì)于網(wǎng)站優(yōu)化有著很重要的作用。
分享題目:網(wǎng)站日志如何分析之實(shí)例解說
URL網(wǎng)址:http://jinyejixie.com/news10/140710.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、Google、做網(wǎng)站、網(wǎng)頁設(shè)計(jì)公司、網(wǎng)站導(dǎo)航、外貿(mào)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容