濮阳杆衣贸易有限公司

主頁 > 知識庫 > 網(wǎng)站日志中的不完整url或莫名其妙的url抓取的分析

網(wǎng)站日志中的不完整url或莫名其妙的url抓取的分析

熱門標(biāo)簽:蘭州手機(jī)自動外呼回?fù)芟到y(tǒng)哪家好 杭州外呼系統(tǒng)卡服務(wù)商 信陽電銷卡外呼系統(tǒng) 紐曼企業(yè)地圖標(biāo)注店 龍圖面館地圖標(biāo)注 二戰(zhàn)前世界殖民地圖標(biāo)注國家中文 崇明縣地圖標(biāo)注 荊州ai智能電話機(jī)器人效果 騰訊云電銷機(jī)器人

在分析日志的過程中,往往會發(fā)現(xiàn)404狀態(tài)下有一些或者很多的不完整的url或者比原url多出字段的莫名其妙的網(wǎng)站本身不存在的url的抓取。在群里面也見有人問過類似的情況,覺得這是一個大家普遍都會遇見的問題,有猜測過有可能是被別人采集才導(dǎo)致這樣的問題出現(xiàn),在上課的時候問過國平老大,當(dāng)時國平老大說有可能是爬蟲在抓取url的時候下載不完整,但是這都沒有一個具體的數(shù)據(jù)來支撐,總是覺得很朦朧沒把握。

現(xiàn)在,google管理員工具可以很清晰的用數(shù)據(jù)為你揭曉這其中的詫異了,google管理員工具是國平老大非常推崇的一個seo工具,有人覺得做百度的人不需要google的東西,因為百度和google的算法有差別,那下面介紹google管理員的這個功能可以告訴你這樣的想法是大錯特錯的,管理員工具是一個按照網(wǎng)站seo各項考核標(biāo)準(zhǔn)制定的一個最最權(quán)威的seo工具,做seo需要的數(shù)據(jù),絕大部分都可以從這里面獲取,下面就來介紹管理員工具的這個功能(好像是最近更新的,以前不是這樣子)。

首頁看下百度日志里面的怪異404

這些url的入口在哪里呢?搜索引擎是從什么地方獲取這些url的?

Google告訴你

首先介紹下google管理員工具關(guān)于抓取錯誤的功能

下面是另一個網(wǎng)站由于改版問題沒做跳轉(zhuǎn)和抓取攔截所造成的找不到抓取錯誤,有一很完整的曲線可以讓你很清晰的看見網(wǎng)站存在的這方面的問題的變化趨勢

和服務(wù)器問題造成的抓取錯誤

接第一張圖(同一個網(wǎng)站)

一開始從日志中觀察到這些錯誤,但是不知道這些錯誤的來源

現(xiàn)在可以知道這些錯誤的url是從何而來

點擊第102條,彈出下面的框,url不在sitemap中,但是在自己的其他網(wǎng)站里面出現(xiàn),說明網(wǎng)址是網(wǎng)站自身存在的但是已經(jīng)被刪除了

點擊第110條,彈出下面的框,可以看到搜索引擎是從其他網(wǎng)站過來的(或是采集站,或是其他)

點擊進(jìn)入具體的來源頁面可以看到

至此,可以很明確的知道,到底網(wǎng)站日志里面的出現(xiàn)的那些莫名其妙的url到底是怎么回事了,是自己站內(nèi)存在的還是站外錯誤構(gòu)成的。最近更新的還有其他的功能,感興趣的朋友可以親自用用體驗下。

原文地址:光年論壇

標(biāo)簽:蘇州 福州 荊州 黑龍江 寶雞 佳木斯 河池 鷹潭

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《網(wǎng)站日志中的不完整url或莫名其妙的url抓取的分析》,本文關(guān)鍵詞  網(wǎng)站,日志,中的,不,完整,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《網(wǎng)站日志中的不完整url或莫名其妙的url抓取的分析》相關(guān)的同類信息!
  • 本頁收集關(guān)于網(wǎng)站日志中的不完整url或莫名其妙的url抓取的分析的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    桐乡市| 贵定县| 塔河县| 凤翔县| 金沙县| 鄂托克前旗| 五河县| 安西县| 延安市| 汾西县| 桂平市| 农安县| 云南省| 黑龙江省| 维西| 扶余县| 常山县| 鄱阳县| 黄石市| 海南省| 阿合奇县| 调兵山市| 阳曲县| 乌兰察布市| 宁远县| 开平市| 全州县| 庄浪县| 富顺县| 张家界市| 唐河县| 肇源县| 勐海县| 鹤壁市| 临夏市| 福州市| 晴隆县| 南华县| 陕西省| 维西| 抚宁县|