大多站長(zhǎng)都知道百度爬蟲(chóng)的重要性,一般你的網(wǎng)頁(yè)參與排名要分四個(gè)步驟,分別是抓取、收錄、索引、展現(xiàn),其中抓取是我們站長(zhǎng)做SEO網(wǎng)站優(yōu)化的第一步,那么問(wèn)題來(lái)了,站長(zhǎng)做網(wǎng)站優(yōu)化的哪些操作會(huì)影響到百度蜘蛛的抓取呢?
百度蜘蛛一般是通過(guò)IP來(lái)進(jìn)行抓取的,同時(shí)對(duì)于某個(gè)IP的抓取數(shù)量也是有限的,如果你的IP上很多站點(diǎn),那么分配到某個(gè)站點(diǎn)的抓取量就會(huì)變低,尤其是同IP有大站的情況。另外一個(gè)方面,同IP的網(wǎng)站有敏感站點(diǎn)或者和你的網(wǎng)站是相似站的話(huà),也會(huì)從側(cè)面影響你網(wǎng)站的抓取,所以,網(wǎng)站優(yōu)化盡量選取獨(dú)立IP。
內(nèi)容質(zhì)量
雖然百度的官方文檔中沒(méi)有出現(xiàn)原創(chuàng)內(nèi)容的詞匯,實(shí)際上百度想要表達(dá)的內(nèi)容是只要是對(duì)客戶(hù)有用的內(nèi)容,雖然不是原創(chuàng)的,但是也會(huì)給與好的排名,所以出現(xiàn)了很多針對(duì)非原創(chuàng)內(nèi)容使用的內(nèi)容生產(chǎn)方法,比較好的方法是內(nèi)容分模塊加隨機(jī)組合,效果很好,收錄也不錯(cuò)。但大部分站長(zhǎng)理解的非原創(chuàng)是轉(zhuǎn)載和抄襲,偽原創(chuàng)等等,百度蜘蛛對(duì)于這類(lèi)站點(diǎn)的態(tài)度可想而知。退一萬(wàn)步說(shuō),如果你真想做偽原創(chuàng),你要至少保證30%的差異性,可以用組合的方式來(lái)解決。
網(wǎng)站要保證內(nèi)容質(zhì)量的另一個(gè)方面是說(shuō)百度對(duì)于某類(lèi)站點(diǎn)的收錄是有限的,百度收錄你的站點(diǎn)前會(huì)給你的網(wǎng)站進(jìn)行評(píng)級(jí),根據(jù)評(píng)級(jí)決定你的網(wǎng)站的收錄量是多少,這就是很多站長(zhǎng)時(shí)間久了收錄會(huì)下降的根本原因。為此,我們需要做的提高有效收錄的數(shù)量,根本原因就是要提供高質(zhì)量的內(nèi)容頁(yè)去覆蓋搜索需求,但不幸的是,高質(zhì)量的內(nèi)容頁(yè)面一般也是原創(chuàng)的,所以,想要偷懶通過(guò)偽原創(chuàng)創(chuàng)造文章內(nèi)容的站長(zhǎng)可以省省了。
網(wǎng)站的打開(kāi)速度和加載速度
網(wǎng)站的打開(kāi)速度會(huì)從側(cè)面影響百度蜘蛛的抓取。雖說(shuō)蜘蛛抓取你的網(wǎng)頁(yè)是沒(méi)有網(wǎng)頁(yè)大小區(qū)別的(實(shí)際上網(wǎng)頁(yè)越大代表你的網(wǎng)頁(yè)的豐富度越大,百度會(huì)給與優(yōu)質(zhì)展現(xiàn)),但從用戶(hù)的角度來(lái)說(shuō),當(dāng)你的網(wǎng)頁(yè)打開(kāi)加載時(shí)間超過(guò)3s,對(duì)于營(yíng)銷(xiāo)型的seo網(wǎng)站就會(huì)增加跳出率,跳出率高了就會(huì)影響你的網(wǎng)站評(píng)級(jí),網(wǎng)站評(píng)級(jí)走低了網(wǎng)站的收錄也就低了。所以網(wǎng)站的打開(kāi)速度會(huì)間接影響百度蜘蛛的爬取。
站點(diǎn)的安全性
站長(zhǎng)必須時(shí)刻注意你站點(diǎn)的安全性問(wèn)題,比如說(shuō)打不開(kāi),黑鏈跳轉(zhuǎn),被抓取了WEBSHELL等,站長(zhǎng)都要第一時(shí)間恢復(fù),并且在百度站長(zhǎng)工具中做好相對(duì)應(yīng)的補(bǔ)救措施。一般網(wǎng)站被黑的結(jié)果都是掛黑鏈,所以有時(shí)間要看一下自己源代碼中是不是加了很多黑鏈,黑鏈都是批量加的,視覺(jué)上很容易分辨。如果你做不了及時(shí)處理,百度爬蟲(chóng)抓取了相關(guān)頁(yè)面或者借此跳轉(zhuǎn)到非法頁(yè)面,會(huì)給你降權(quán),一般通過(guò)掛黑鏈引起的降權(quán)百度是很不容易恢復(fù)排名的。