濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > 怎么利用robots文件做好網(wǎng)站優(yōu)化讓蜘蛛更好的抓取網(wǎng)站?

怎么利用robots文件做好網(wǎng)站優(yōu)化讓蜘蛛更好的抓取網(wǎng)站?

熱門(mén)標(biāo)簽:智能電話(huà)機(jī)器人模式 電銷(xiāo)機(jī)器人最早是哪家 樂(lè)山400電話(huà)申請(qǐng) 大連市地圖標(biāo)注 電銷(xiāo)機(jī)器人牌子 廣東高頻外呼防封系統(tǒng) 長(zhǎng)春移動(dòng)外呼系統(tǒng)收費(fèi) 安陽(yáng)ai電話(huà)機(jī)器人價(jià)位 400電話(huà)申請(qǐng)到易號(hào)網(wǎng)

  robots文件存在于網(wǎng)站根目錄,是用來(lái)告訴百度蜘蛛那些應(yīng)該抓取,那些不應(yīng)該抓取。正確使用robots文件有助于做好seo優(yōu)化,robots文件的核心詞匯就是allow和disallow用法。百度官網(wǎng)是認(rèn)可這個(gè)文件的,在百度站長(zhǎng)平臺(tái)上也有robots這個(gè)欄目,點(diǎn)擊進(jìn)入,就可以看到你網(wǎng)站robots文件是否編寫(xiě)正確了。

  百度robots文件使用說(shuō)明

  1、robots.txt可以告訴百度您網(wǎng)站的哪些頁(yè)面可以被抓取,哪些頁(yè)面不可以被抓取。

  2、您可以通過(guò)Robots工具來(lái)創(chuàng)建、校驗(yàn)、更新您的robots.txt文件,或查看您網(wǎng)站robots.txt文件在百度生效的情況。

  3、Robots工具暫不支持https站點(diǎn)。

  4、Robots工具目前支持48k的文件內(nèi)容檢測(cè),請(qǐng)保證您的robots.txt文件不要過(guò)大,目錄最長(zhǎng)不超過(guò)250個(gè)字符。

  

  上圖我給的一個(gè)例子中,disallow語(yǔ)句有問(wèn)題,原因是把英文的冒號(hào)寫(xiě)成了中文的冒號(hào)。

  當(dāng)然直接輸入網(wǎng)站根目錄加上robtots.txt文件也可以

  

  User-agent:*   是用來(lái)置頂那些搜索引擎蜘蛛可以抓取的,一般默認(rèn)設(shè)置

  Disallow:/category/*/page/ 分類(lèi)目錄下面翻頁(yè)后的鏈接,比如,進(jìn)入校賺網(wǎng)分類(lèi)目錄 "推廣運(yùn)營(yíng)經(jīng)驗(yàn)"目錄后,在翻頁(yè)一次,就成了 stcash.com/category/tuiguangyunying/page/2形式了

  Disallow:/?s=* Disallow:/*/?s=*  搜索結(jié)果頁(yè)面和分類(lèi)目錄搜索結(jié)果頁(yè)面,這里沒(méi)必要再次抓取。

  Disallow:/wp-admin/ Disallow:/wp-content/ Disallow:/wp-includes/   這三個(gè)目錄是系統(tǒng)目錄,一般都是屏蔽蜘蛛抓取

  Disallow:/*/trackback  trackback的鏈接

  Disallow:/feed Disallow:/*/feed Disallow:/comments/feed  訂閱鏈接

  Disallow:/?p=*   文章短鏈接,會(huì)自動(dòng)301跳轉(zhuǎn)到長(zhǎng)連接

  例如,朱海濤博客之前就被收錄過(guò)短連接

  Disallow:/*/comment-page-*   Disallow:/*?replytocom* 這兩個(gè)我在之前文章有過(guò)說(shuō)明,來(lái)自于評(píng)論鏈接,很容易造成重復(fù)收錄。

  在robots.txt文件的最后還可以制定sitemap文件 Sitemap:http://***.com/sitemap.txt

  sitemap地址指令,主流是txt和xml格式。在這里分享一段張戈所寫(xiě)txt格式的simemap文件。

  將上述代碼保存到txt文件,上傳到根目錄,并且在robots.txt文件中指定即可

  這里給大家共享下我的robots.txt文件

復(fù)制內(nèi)容到剪貼板
  1.   User-agent: *   
  2.   
  3.   Disallow:/wp-admin/   
  4.   
  5.   Disallow: /*/comment-page-*  
  6.  
  7.   Disallow: /*?replytocom*  
  8.  
  9.   Disallow: /wp-content/  
  10.  
  11.   Disallow: /wp-includes/  
  12.  
  13.   Disallow: /category/*/page/   
  14.   
  15.   Disallow: /*/trackback  
  16.  
  17.   Disallow: /feed  
  18.  
  19.   Disallow: /*/feed   
  20.   
  21.   Disallow: /comments/feed   
  22.   
  23.   Disallow: /?s=*   
  24.   
  25.   Disallow: /*/?s=*\  
  26.  
  27.   Disallow: /attachment/  
  28.  
  29.   Disallow: /tag/*/page/   
  30.   
  31.   Sitemap: http://www.stcash.com/sitemap.xml  

標(biāo)簽:滁州 江門(mén) 儋州 深圳 三明 克拉瑪依 銀川 鶴壁

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《怎么利用robots文件做好網(wǎng)站優(yōu)化讓蜘蛛更好的抓取網(wǎng)站?》,本文關(guān)鍵詞  怎么,利用,robots,文件,做好,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《怎么利用robots文件做好網(wǎng)站優(yōu)化讓蜘蛛更好的抓取網(wǎng)站?》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于怎么利用robots文件做好網(wǎng)站優(yōu)化讓蜘蛛更好的抓取網(wǎng)站?的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    金溪县| 富锦市| 锦屏县| 灵石县| 通化市| 沧州市| 静海县| 敦煌市| 华宁县| 房产| 绥中县| 平泉县| 西吉县| 潮州市| 安平县| 定南县| 庆阳市| 阿拉善盟| 玛多县| 逊克县| 比如县| 城步| 乐安县| 信宜市| 思茅市| 嘉峪关市| 安平县| 鸡泽县| 新平| 开鲁县| 景东| 达日县| 石景山区| 瑞昌市| 沧州市| 杂多县| 汝州市| 东阳市| 长沙市| 仁寿县| 怀仁县|