濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > 使用shell腳本找出網(wǎng)站的空頁(yè)面和404錯(cuò)誤頁(yè)面

使用shell腳本找出網(wǎng)站的空頁(yè)面和404錯(cuò)誤頁(yè)面

熱門(mén)標(biāo)簽:旅游地圖標(biāo)注大全 百度地圖標(biāo)注圖標(biāo)更換 東莞電銷機(jī)器人價(jià)格一覽表 excel地址地圖標(biāo)注 陜西電銷卡外呼系統(tǒng)怎么安裝 地圖標(biāo)注超出范圍怎么辦 杭州機(jī)器人外呼系統(tǒng) 百度地圖的地圖標(biāo)注 佛山高德地圖標(biāo)注中心

早之前記的一個(gè)筆記了,之前只是記錄了兩句代碼,放出來(lái)的話也是一個(gè)低質(zhì)量的頁(yè)面,于是設(shè)置為了僅自己可見(jiàn),今晚抽空補(bǔ)充一下。

記得當(dāng)?shù)那榫皯?yīng)該是提交sitemap時(shí)百度老提示有錯(cuò)誤的URL,導(dǎo)致sitemap不能正常被抓取,于是在想辦法解決這個(gè)問(wèn)題,所以才有下面這些筆記:用shell批量找出網(wǎng)站空頁(yè)面和404錯(cuò)誤頁(yè)面。

廢話不多說(shuō),直接上shell代碼:

復(fù)制代碼 代碼如下:

time cat sitemap.txt|while read line;do curl -l $line -m 5 --connect-timeout 5 -o /dev/null -s -w "$line "%{http_code}" "%{size_download}"\n";done

前面加了一個(gè)time是為了看看代碼執(zhí)行所花的時(shí)間

%{http_code}意思是返回HTTP狀態(tài)碼,通過(guò)這個(gè)狀態(tài)碼我們就能知道該鏈接是正常的200鏈接,還是404錯(cuò)誤鏈接;

%{size_download}意思是返回當(dāng)前頁(yè)面的大小,如果值太小的話,說(shuō)明這些頁(yè)面很有可能是低質(zhì)量的空頁(yè)面,得想辦法剔除掉。

標(biāo)簽:隨州 延邊 青島 朝陽(yáng) 通遼 西藏 南充 雅安

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用shell腳本找出網(wǎng)站的空頁(yè)面和404錯(cuò)誤頁(yè)面》,本文關(guān)鍵詞  使用,shell,腳本,找出,網(wǎng),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《使用shell腳本找出網(wǎng)站的空頁(yè)面和404錯(cuò)誤頁(yè)面》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于使用shell腳本找出網(wǎng)站的空頁(yè)面和404錯(cuò)誤頁(yè)面的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    前郭尔| 东乡族自治县| 开化县| 紫金县| 冷水江市| 资中县| 日喀则市| 富川| 台南市| 汽车| 宜章县| 托克逊县| 尉氏县| 临漳县| 荥阳市| 瓮安县| 贵德县| 图片| 辽阳县| 铜陵市| 贵溪市| 湖南省| 冷水江市| 临澧县| 漳平市| 长葛市| 哈尔滨市| 定南县| 望都县| 台东县| 喜德县| 盐城市| 昔阳县| 金平| 义马市| 临颍县| 镇赉县| 屯昌县| 昭通市| 扬州市| 阳山县|