![](/d/20211019/f18adf38ad7e4ff5f98116def47bdfe5.gif)
12月30日消息 日前,百度站長平臺2014年最后一場高端沙龍在廣州落下帷幕。本次沙龍圍繞著“搜索引擎優(yōu)化”這一話題展開了一些列的討論。百度站長平臺專家王淘、草根個人站長代表搜外創(chuàng)始人夫唯、以及大型網(wǎng)站代表太平洋SEO負責(zé)人黃勇一起探討了有關(guān)搜索引擎趨勢,搜索引擎喜好以及工程師們在實操中遇到的技術(shù)問題。
在之前站長之家發(fā)布的文章《對話百度站長平臺:搜索引擎的趨勢和喜好》中分享了搜外創(chuàng)始人夫唯和百度lee代言人王淘關(guān)于搜索引擎趨勢及喜好的對話內(nèi)容。今天要分享的是技術(shù)男們最關(guān)注的SEO實操方面的相關(guān)知識。
延伸閱讀:對話百度站長平臺:搜索引擎的趨勢和喜好
主要內(nèi)容如下:
黃勇:有一天我們有一個網(wǎng)站發(fā)現(xiàn)來了非常多的爬蟲,給服務(wù)器造成了極大的壓力。于是我們緊急屏蔽了所有爬蟲IP和UA??墒堑纫欢螘r間后,我們解除解禁后,卻發(fā)現(xiàn)恢復(fù)起來非常緩慢,基本上兩個月后才回到了當時的水平。大家的站越做越大,肯定會遇到龐大的訪問壓力、抓蟲抓取方面的問題,所以想借此機會咨詢一下,看在這方面有沒有一個好的解決辦法。
王淘:理論上講,站點屏蔽了Baiduspider后的恢復(fù)周期的確比較長,但是有沒有措施就請孫權(quán)講一下了。
孫權(quán):通過封禁UA或IP的方式來拒絕百度蜘蛛,一天以上后果都是非常嚴重的。就這個問題來說目前沒有快速的方法可以讓你在短時間內(nèi)恢復(fù)。這是站點自身運行的一個故障,并不是百度策略上面有什么問題。還有就是,網(wǎng)站在無法訪問期間,很多因子都會受到影響,百度在給網(wǎng)站進行綜合打分時會綜合計算多個因子,所以說,即使是網(wǎng)站訪問恢復(fù)了,但其它因子的負面影響還在,網(wǎng)站恢復(fù)起來也還是非常困難的。
(接上)
觀眾提問:用閉站保護能解決這個問題嗎?
孫權(quán):不能。閉站保護前提是把網(wǎng)站死掉,指的是爬蟲不能抓取,同時用戶也訪問不了。。
(接上)
王淘:其實我建議不管對什么樣的IP或者UA都不要直接封禁,設(shè)置502會好一點。
黃勇:當時我們也有想過設(shè)置502,但考慮到這個問題不是短期內(nèi)能夠解決的,擔(dān)心使用502被搜索引擎視為欺騙,畢竟是服務(wù)器的問題嘛,應(yīng)該是403,干嘛告訴人家說是502。我們非常害怕因為使用取巧的做法而帶來更嚴重的后果
王淘:這個還好,如果你網(wǎng)頁明確不想讓搜索引擎訪問就403就好了,如果走屏蔽其實502也無所謂,僅僅是我們浪費流量重新抓幾次,這是比較謹慎的情況。我們抓不到你們內(nèi)容對我們來說也是損失。
(接上)
孫權(quán):可能很多站長會問,為什么我的站持續(xù)一段時間訪問不了后排名會掉得那么厲害,就是因為百度認為網(wǎng)站可訪問性有問題,目前百度對可訪問性有問題的網(wǎng)站打壓是非常厲害的。所以,面對網(wǎng)站爬蟲訪問量突增的情況,我不建議站長立刻去封我們的爬蟲,你可以通過百度站長平臺抓取頻次工具,把這個爬蟲壓力調(diào)低,但是不可以封掉。比如本來一天來抓50萬,你調(diào)低到2萬,我們后臺的Spider策略都是認這個值的。
黃勇:《301跳轉(zhuǎn)常見問題匯總》文章中提到站點設(shè)置301后,“百度不會刪除舊網(wǎng)頁,新舊網(wǎng)頁同時存在,百度在搜索結(jié)果中會優(yōu)先展現(xiàn)新網(wǎng)頁”,但實際情況是,會發(fā)生新舊頁面交替獲得排名的現(xiàn)象,這是什么原因?
延伸閱讀:301跳轉(zhuǎn)常見問題匯總
王淘:這個問題主要是由我們的系統(tǒng)造成的。我們系統(tǒng)有非常多的模塊,每個模塊都要去單獨處理301更替,偶爾有一些模塊的處理邏輯可能有出現(xiàn)問題,可能出現(xiàn)一些波動。我們在6月份左右時做過一次大規(guī)模的改進,基本上把所有的模塊都理了一遍,把所有歸一化都做了統(tǒng)一,現(xiàn)在這樣的問題比較少了。
黃勇:百度快照時間與頁面質(zhì)量、抓取更新頻率是否有什么關(guān)系?
王淘:快照時間沒有任何參考價值,在排序時我們使用單獨的抓取時間統(tǒng)計系統(tǒng),外部不可見,站點完全不用關(guān)注百度的快照時間。
![](/d/20211019/c263674a8f60a7462b09b634c3fcc733.gif)
黃勇:文章頁的邊欄、底部部署大量與當前文章間接相關(guān)的鏈接,是否會認被為噪聲?是否影響頁面本身內(nèi)容識別和收錄?
王淘:網(wǎng)頁在建庫時會判斷頁面的主體內(nèi)容,而邊框這部分的內(nèi)容基本不算在內(nèi),所以基本不會有影響,只有一些鏈接發(fā)現(xiàn)的作用。
![](/d/20211019/de41cc0c858c1aa9cc8ed0211b9d679c.gif)
黃勇:Canonical 的使用范圍,百度提到“高度相似”,這個“高度相似”到底是什么標準?例如這兩個頁面:
http://v.duowan.com/u/122769172
http://v.duowan.com/index.php?r=user/videolistuid=122769172
王淘:“高度相似”是指網(wǎng)站的標題、主體內(nèi)容以及網(wǎng)站的結(jié)構(gòu)都相似,從這個案例來看網(wǎng)站結(jié)構(gòu)不同,對Baiduspider來說完全是兩個不同頁面,canonical標簽不會生效。
黃勇:請問百度如何看待一個采集了優(yōu)質(zhì)內(nèi)容,但瀏覽體驗和訪問性都好的網(wǎng)站?
王淘:對于百度來說,能夠提供滿足用戶需求的內(nèi)容、有良好用戶體驗的網(wǎng)站就是好網(wǎng)站。有些站點從從外站轉(zhuǎn)載來內(nèi)容,經(jīng)過加工提供了內(nèi)容增益,更好的滿足了用戶需求,同樣可以得到好的展現(xiàn)。