前段時間增加了建站二級域名,原來博客站的主域名不帶www,把主域調(diào)整為mengdiqiu.com.cn之后,需要做幾個重要修改,否則權(quán)重就會分散,降低網(wǎng)站權(quán)重。分享血的教訓(xùn),讓新站長少走彎路。
本博客剛開始的時候主域是xiuzhanwang.com,但很多帶www的頁面被收錄,不想讓百度再抓取這些頁面,如何刪除呢?這讓秀站網(wǎng)秀站網(wǎng)相當(dāng)煩惱。
重復(fù)收錄頁面的原因
1.動態(tài)內(nèi)容已被抓取
百度蜘蛛會根據(jù)頁面的鏈接情況爬取并放出快照,如頁面內(nèi)容調(diào)整或者刪除了,快照就較難刪除。
常見的有: /tag.php?/%CF%D6%B4%FA%BC%F2%D4%BC/ (tag標(biāo)簽) /plus/list.php?tid=3 (dede動態(tài)列表) /plus/list.php?tid=85&zxfg=%CF%D6%B4%FA%BC%F2%D4%BC等 (dede篩選)
有的朋友說把那些頁面設(shè)置為404就好,參考文章《網(wǎng)頁404頁面制作及注意事項》但是已經(jīng)被刪除的靜態(tài)頁面還好,動態(tài)頁面就沒辦法。建議新手采用靜態(tài)頁面的方式學(xué)習(xí)SEO。
2.仍存在相對路徑
相對路徑形式 /web/ (目錄) /seo/ (目錄) /images/logo.png /css/style.css 絕對路徑形式 http://mengdiqiu.com.cn/web/ (目錄) http://mengdiqiu.com.cn/seo/ (目錄) http://mengdiqiu.com.cn/images/logo.png (文件) http://mengdiqiu.com.cn/css/style.css (文件)
mengdiqiu.com.cn的實際上是二級域名(和m.xiuzhanwang.com是同等的權(quán)重),如果兩個域名都被抓取了,并且URL是相對路徑,百度蜘蛛會在兩個域名下重復(fù)抓取,放出的快照是有一些www,一些又沒有www。建議URL路徑采用絕對路徑的方式,即使被收錄了,久而久之也會慢慢的恢復(fù),只是時間比較長。設(shè)置方法參考文章《什么是URL絕對路徑和相對路徑SEO優(yōu)化重要環(huán)節(jié)》
3.突然改變主要域名
原主域名xiuzhanwang.com 修改為mengdiqiu.com.cn
90%以上的新網(wǎng)站都沒做好301,不然為什么還有這么網(wǎng)站需要優(yōu)化呢?301原來用得比較多的是換域名,現(xiàn)在做網(wǎng)站SEO游湖是不可能找個新域名,地球人都知道老域名相對更容易些。
中途才做的301,舊快照消失經(jīng)常持續(xù)幾個月不等,很明顯感覺排名受影響。百度蜘蛛經(jīng)常對正常優(yōu)化方法有延后性,但是對黑帽的卻響應(yīng)及時得很...改變域名的影響參考文章《避免更換域名或改版帶來的損失降到最小》
4.中途才設(shè)置偽靜態(tài)
搜索引擎確實對靜態(tài)頁面有青睞,但每次都要生成,如果虛擬空間支持.htaccess的就能做偽靜態(tài),形式如:
動態(tài): http://mengdiqiu.com.cn/plus/list.php?tid=1 偽靜態(tài): http://mengdiqiu.com.cn/list-1.html
秀站網(wǎng)已經(jīng)寫了很多關(guān)于偽靜態(tài)的文章了,點擊查看偽靜態(tài)設(shè)置,一般偽靜態(tài)是后面進階優(yōu)化的時候才做的,一般SEOer接手的網(wǎng)站都是較差的...這樣的情況解決起來比較棘手。
5.自帶的臨時三級域名被收錄
每個購買的空間都有一個臨時域名,其實被抓取臨時域名這樣的情況還是比較多見,所以在剛開始建站的時候用robots屏蔽全站,建設(shè)好了才讓蜘蛛抓取,解決的辦法只能是301。參考文章《什么是robots協(xié)議對seo的影響》
6.網(wǎng)站多次改版
一個網(wǎng)站剛開始的時候都會進行或多或少的調(diào)整,包括結(jié)構(gòu)調(diào)整和內(nèi)容調(diào)整等,有很多死鏈產(chǎn)生。拿到手的網(wǎng)站都比較差的原因,死馬當(dāng)活馬醫(yī)的情況還是比較多,除非網(wǎng)站有上千個被收錄,這時死鏈比較影響權(quán)重。
一些情況較差的網(wǎng)站就可以調(diào)整后重新生成網(wǎng)站地圖,向百度提交死鏈。設(shè)置方法:網(wǎng)站地圖sitemap,如果是有規(guī)律的話可以提交網(wǎng)站改版,寫好改版規(guī)則即可,最終完成全部改版時間也是1-3個月不等。
刪除重復(fù)收錄的百度快照方法
1.閉站保護
找了很多網(wǎng)上資源,由于站內(nèi)寫了比較多的.htaccess規(guī)則,比較麻煩,還是選擇百度工具的“閉站保護”功能,有朋友誤解為能刪除這些快照,其實這些快照不被人看到而已,還是存在索引。當(dāng)然而且又一定的時間限制。
把不想被抓取的域名申請閉站保護,一般都會通過,也不需要讓頁面返回404,會在2小時左右閉站成功。
2.全部鏈接換成絕對路徑
不管被抓取的頁面如何,如果里面的路徑都是主要域名的路徑,權(quán)重也不會分散到哪里,蜘蛛就不會重復(fù)爬取頁面。
3.加大更新高質(zhì)量原創(chuàng)文章
在做了必要的301重定向和絕對路徑修改之后,百度會進一步考察新域名的情況,這個時候一定要加大高質(zhì)量的文章內(nèi)容,這樣新域名和老域名的情況就有不同,蜘蛛會積極爬取,久而久之百度就停止老域名的抓取。
4.對已被搜索引擎抓取的頁面處理
靜態(tài)頁面直接向百度提交404就好, 針對某些動態(tài)頁面,比如搜索頁面、問答頁面等,這些如果被抓取了很有可能會影響我們網(wǎng)站的關(guān)鍵詞庫,方法有很多:
①聲明該頁面不建立索引,在源代碼</head>之前加
<meta name="robots" content="noindex">
②robots聲明不允許抓。
③在頁面的<title><keywords><description>不調(diào)用任何搜索詞,動態(tài)搜索頁面是不那么容易被刪除的,前段時間還有萬網(wǎng)搜索讓黑客注入大量的垃圾信息,造成SEO排名下降,就是調(diào)用了這些搜索詞;
剩下的就是等搜索引擎進一步處理了,這時候應(yīng)該多更新高質(zhì)量內(nèi)容吸引蜘蛛來爬取頁面。