快照數(shù)量多少雖然不能決定你的最終排名,但的確是作為一個(gè)重要的參考標(biāo)準(zhǔn)。一般的中小企業(yè)站收錄普遍在1000條以下,甚至在500條以下。這就意味著,在相同的條件下,當(dāng)然收錄越多得分越高,排名越好。收錄量不過(guò)百,但排名很好的情況是比較少見(jiàn)的,當(dāng)然如果這個(gè)詞沒(méi)有什么競(jìng)爭(zhēng)度還是多見(jiàn)。
我們從快照上可以判斷網(wǎng)站的健康度,主要包括:快照數(shù)量增減、索引和快照數(shù)量不一致、site命令首頁(yè)的排位、404錯(cuò)誤頁(yè)面多少、重復(fù)收錄帶www和不帶www的域名頁(yè)面、收錄了不該收錄的頁(yè)面等。
快照數(shù)量的增減
快照收錄有時(shí)候會(huì)因?yàn)樗惴ǖ恼{(diào)整,會(huì)有波動(dòng),下跌100以?xún)?nèi)都是正常的。但如果超過(guò)這個(gè)合理范圍,并且超過(guò)半個(gè)月沒(méi)有恢復(fù),就應(yīng)該檢查是否存在很多低質(zhì)量頁(yè)面,被算法去重了。另外有時(shí)候頁(yè)面會(huì)出現(xiàn)404錯(cuò)誤頁(yè)面和一些帶“?”動(dòng)態(tài)頁(yè)面,這些系統(tǒng)會(huì)自動(dòng)移出索引庫(kù)。
索引和快照數(shù)量
這兩者是在絕大多數(shù)時(shí)候是不相等的,搜索引擎會(huì)對(duì)所有頁(yè)面進(jìn)行抓取并分析,內(nèi)容質(zhì)量比較好的頁(yè)面會(huì)建立索引,并在一段時(shí)間內(nèi)放出快照。每個(gè)地區(qū)甚至?xí)醒舆t,這就是排名并不是我們認(rèn)為的可以人為控制。相關(guān)文章
- SEO查詢(xún)百度索引量和收錄量的區(qū)別
- 網(wǎng)站索引量每天增加但快照量不增的原因分析
一般以索引為主,用site命令查詢(xún)的是快照數(shù)量,site命令查詢(xún)的值容易出現(xiàn)波動(dòng)。
首頁(yè)快照消失
用site命令查詢(xún)網(wǎng)站收錄情況,一般首頁(yè)會(huì)排在所有快照的前面。如果下落了兩三位,但并不持續(xù)很久,兩三天內(nèi)就恢復(fù)的話(huà)是不用過(guò)于擔(dān)心的。特別是我們提交了快照更新,排位是會(huì)受影響的。
筆者有一次頁(yè)面做了較大調(diào)整后,提交了快照更新,然后好幾天都沒(méi)放出來(lái),也就是本帖提到的首頁(yè)快照消失。這時(shí)候最好盡量多做些高質(zhì)量?jī)?nèi)容,讓搜索引擎抓取。這次調(diào)整后,快照是過(guò)了3-4天才放出來(lái)了,排名得到了很大的提升,而且首頁(yè)的logo圖片也展示,是比較好的結(jié)果。如果你的網(wǎng)站不是這樣的結(jié)果就要多注意了,畢竟好幾天看不到快照也就是沒(méi)有排名了,意味著你的業(yè)務(wù)會(huì)受影響。
做頁(yè)面調(diào)整的原則是往好的方向調(diào),一些沒(méi)有點(diǎn)擊的區(qū)域完全可以去除,頁(yè)面過(guò)長(zhǎng)的也可以砍掉。SEO優(yōu)化做的首先是做減法,也就是大家說(shuō)的“過(guò)度優(yōu)化”。如果流量還不能滿(mǎn)足,再仔細(xì)做需求分析,增加內(nèi)容,豐富頁(yè)面。
404錯(cuò)誤頁(yè)面
如果是動(dòng)態(tài)頁(yè)面,404錯(cuò)誤一般是URL發(fā)生變化。如果是靜態(tài)頁(yè)面,404錯(cuò)誤是該頁(yè)面已被刪除或目錄結(jié)構(gòu)發(fā)生變化。靜態(tài)頁(yè)面比較容易處理,動(dòng)態(tài)頁(yè)面就稍微復(fù)雜了。
路徑做了偽靜態(tài)后,如果動(dòng)態(tài)的URL已經(jīng)被收錄,頁(yè)面html返回碼一樣是200而不是404,屬于正常頁(yè)面,快照是非常難刪除的。動(dòng)態(tài)和偽靜態(tài)頁(yè)面有可能重復(fù)收錄。
重復(fù)收錄頁(yè)面
由于沒(méi)做好301處理,帶www和不帶www的頁(yè)面URL路徑不一樣,但內(nèi)容是完全一樣的,類(lèi)似下面的情況:
https://www.vi586.com/seo/ https://vi586.com/seo/ https://www.vi586.com/list.php?tid=1 https://vi586.com/list.php?tid=1
這上面的URL指向是同一個(gè)頁(yè)面,前兩個(gè)是靜態(tài)URL或偽靜態(tài)URL,后兩個(gè)是動(dòng)態(tài)URL。生成的靜態(tài)頁(yè)面稍有延遲,剛好蜘蛛來(lái)抓取,就有可能出現(xiàn)動(dòng)態(tài)、靜態(tài)內(nèi)容不同步,頁(yè)面相似度降低,容易出現(xiàn)動(dòng)態(tài)、靜態(tài)URL的頁(yè)面重復(fù)收錄,同樣的這些動(dòng)態(tài)URL快照都不好刪除。
敏感文件夾或文件被收錄
大家一定以為蜘蛛只抓頁(yè)面上的內(nèi)容,只會(huì)沿著頁(yè)面上的錨文本爬取更多內(nèi)容。一些敏感的文件夾或文件被收錄,這是非常不安全的,容易被不法者利用?捎胷obots.txt進(jìn)行屏蔽,參考文章
- 別讓網(wǎng)站的robots成為最大的安全漏洞
- robots禁止抓取規(guī)則為什么還被收錄
上面的方法處理好之后,想讓這些敏感的快照徹底消失,可以把敏感的文件或文件夾重命名,造成404錯(cuò)誤,但前提是要對(duì)程序比較了解,不然會(huì)容易出錯(cuò)哦。