濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > 搜索引擎蜘蛛爬行網(wǎng)站足跡解讀

搜索引擎蜘蛛爬行網(wǎng)站足跡解讀

熱門標(biāo)簽:望都縣地圖標(biāo)注app 電銷機(jī)器人排行榜前十名 云趣在線n個(gè)你電銷機(jī)器人 呼和浩特ai外呼系統(tǒng)軟件 電話機(jī)器人一個(gè)月的費(fèi)用 ai電銷機(jī)器人效果好嗎 太原電銷外呼系統(tǒng)多少錢 電銷外呼防封號(hào)系統(tǒng) 電話機(jī)器人公司哪個(gè)好
你把IIS日志從空間下到本地,然后用文本工具打開(kāi);

  2010-05-14 15:52:03 W3SVC1 121。187。5。143 GET /category-8-b0-min1100-max2200.html - 80 - 220.181.7.74 Baiduspider+(+baidu/search/spider.htm) 200 0 0

  分析下 200 0 0組成部分 sc-status(協(xié)議狀態(tài)) sc-substatus(協(xié)議子狀態(tài)) sc-win32-status(Win32狀態(tài)碼)

  sc-status(協(xié)議狀態(tài)): 200 連接成功

  sc-substatus(協(xié)議子狀態(tài)) :0 成功

  sc-win32-status(Win32狀態(tài)碼):0 代表抓取成功并帶回?cái)?shù)據(jù)庫(kù) ; 64 指定的網(wǎng)絡(luò)名不再可用

  1: 在這個(gè)訪問(wèn)記錄里面121.187.5.143是你服務(wù)器的IP地址,220.181.7.74 是bd蜘蛛的IP,/category-8-b0-min1100-max2200.html 為蜘蛛訪問(wèn)你的頁(yè)面 80是端口 GET是打開(kāi)方式 W3SVC1是記錄的文件夾,這里說(shuō)明,bd蜘蛛已經(jīng)訪問(wèn)了你的category-8-b0- min1100-max2200.html 這個(gè)頁(yè)面,那么最重要的是最后面的這個(gè)參數(shù)200 0 0。

  2、200 0 0 成功訪問(wèn)該頁(yè)面,0代表抓取成功并帶回?cái)?shù)據(jù)庫(kù)。這個(gè)時(shí)候你就放心了,這個(gè)頁(yè)面已經(jīng)被bd收錄,但是還沒(méi)有釋放出來(lái),bd更新時(shí)就可能釋放出來(lái)。

  3:200 0 64 網(wǎng)絡(luò)上流傳著這么三種解釋第一:64為K站的前兆。第二64的出現(xiàn)只是64位操作系統(tǒng)。第三:網(wǎng)絡(luò)不可達(dá),由于某種原因無(wú)法完全打開(kāi)頁(yè)面,或者網(wǎng)絡(luò)不穩(wěn)定這些原因,導(dǎo)致蜘蛛無(wú)法帶回頁(yè)面或者說(shuō)不抓取該頁(yè)面,所以200 0 64的解釋也應(yīng)該為:訪問(wèn)了該頁(yè)面,但并沒(méi)有任何抓取也沒(méi)有帶回?cái)?shù)據(jù)庫(kù)。這種原因多為空間不穩(wěn)定、服務(wù)器不穩(wěn)定。

  4:304 0 0這個(gè)返回碼代表蜘蛛訪問(wèn)的頁(yè)面沒(méi)有更新,和他之前來(lái)的時(shí)候是一樣的,所以看到這個(gè)不要擔(dān)心,蜘蛛來(lái)過(guò),只不過(guò)你沒(méi)有更新,所以他也不愿意帶走這個(gè)頁(yè)面。

  5:404 0 0這個(gè)是代表404頁(yè)面,但是有個(gè)很嚴(yán)重的問(wèn)題,這個(gè)返回碼告訴我們,蜘蛛來(lái)到了404頁(yè)面并把他帶走了,崩潰~~~~,要是這樣的話基本上你要倒霉了,要你有太多的404,那么蜘蛛就會(huì)不斷是抓取,不斷的帶走,這樣會(huì)造成無(wú)數(shù)的重復(fù)頁(yè)面,最終導(dǎo)致K站或者降權(quán),正確的返回罵是404 0 64 這就代表蜘蛛沒(méi)有抓取你這個(gè)頁(yè)面。

  6:500錯(cuò)誤500錯(cuò)誤是服務(wù)器內(nèi)部錯(cuò)誤,是由程序的錯(cuò)誤造成的,我不懂程序,但是500錯(cuò)誤是會(huì)給你減分的,這點(diǎn)基本的邏輯都可以想的到,要發(fā)現(xiàn)500錯(cuò)誤,馬上查看是哪個(gè)頁(yè)面的,然后去修正以下錯(cuò)誤吧!

  7:302要在日志中發(fā)現(xiàn)302的返回碼也是需要注意的,302為臨時(shí)重定向,要你是長(zhǎng)期的將這個(gè)頁(yè)面重定向到另一個(gè)頁(yè)面,麻煩你使用301永久重定向,要是302的話bd蜘蛛下次來(lái)還會(huì)訪問(wèn)這個(gè)頁(yè)面,這樣又會(huì)造成復(fù)制大量頁(yè)面的問(wèn)題,結(jié)果肯定是K,所以,抽空檢查以下。

  陳中平的回復(fù):

  每個(gè)網(wǎng)絡(luò)蜘蛛都有自己的名字,在抓取網(wǎng)頁(yè)的時(shí)候,都會(huì)向網(wǎng)站標(biāo)明自己的身份。網(wǎng)絡(luò)蜘蛛在抓取網(wǎng)頁(yè)的時(shí)候會(huì)發(fā)送一個(gè)請(qǐng)求,這個(gè)請(qǐng)求中就有一個(gè)字段為User-agent,用于標(biāo)識(shí)此網(wǎng)絡(luò)蜘蛛的身份。例如Google網(wǎng)絡(luò)蜘蛛的標(biāo)識(shí)為GoogleBot,Baidu網(wǎng)絡(luò)蜘蛛的標(biāo)識(shí)為BaiDuSpider,Yahoo網(wǎng)絡(luò)蜘蛛的標(biāo)識(shí)為Inktomi Slurp。如果在網(wǎng)站上有訪問(wèn)日志記錄,網(wǎng)站管理員就能知道,哪些搜索引擎的網(wǎng)絡(luò)蜘蛛過(guò)來(lái)過(guò),什么時(shí)候過(guò)來(lái)的,以及讀了多少數(shù)據(jù)等等。

  通過(guò)ftp,查看到后臺(tái)有一個(gè)包含“log”的文件。這個(gè)文件就是日志。通過(guò)查看日志中是否有baiduspider的腳印。有baiduspider就說(shuō)明bd蜘蛛來(lái)過(guò)網(wǎng)站。

  小刀SEO 的回復(fù):

  網(wǎng)站日志一般存放在虛擬主機(jī)的logfiles文件夾下,可以通過(guò)FTP工具將網(wǎng)站日志下載下來(lái),通過(guò)txt文檔方式查看。

標(biāo)簽:楊凌 泰州 黃石 廣東 中山 海西 嘉峪關(guān)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《搜索引擎蜘蛛爬行網(wǎng)站足跡解讀》,本文關(guān)鍵詞  搜索引擎,蜘蛛,爬行,網(wǎng)站,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《搜索引擎蜘蛛爬行網(wǎng)站足跡解讀》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于搜索引擎蜘蛛爬行網(wǎng)站足跡解讀的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    昆明市| 连山| 墨竹工卡县| 阜城县| 容城县| 张家口市| 霍城县| 蓬莱市| 铁力市| 贺州市| 蚌埠市| 颍上县| 梁山县| 清水县| 醴陵市| 邹平县| 张北县| 西丰县| 崇礼县| 商都县| 尤溪县| 合江县| 泽州县| 闻喜县| 姜堰市| 湛江市| 金乡县| 阳东县| 丹棱县| 萨嘎县| 宾川县| 昆明市| 乌兰浩特市| 天长市| 文水县| 额尔古纳市| 营口市| 和平县| 报价| 临沧市| 五大连池市|