一些做站群的站長總在擔心頁面相似度的問題,認為控制在合理范圍內(nèi)就不會受到懲罰,其實百度對網(wǎng)站的懲罰還是有自己的一套手段,不是太惡劣的話只要你“有所悔改”,就會“寬大處理”。
301處理
所謂頁面相似度很高的絕大多數(shù)網(wǎng)站是因為沒做好301,比如帶www和不帶www的域名,相似度是100%;帶 .html、.php等后綴的和不帶后綴的頁面相似度也是100%,這個才是真正被認為是作弊,基本上不會給你很好的排名。
這種情況較好解決,如果發(fā)現(xiàn)自己的網(wǎng)站排名始終上不去,就盡快把這些URL全部跳轉(zhuǎn)到主URL,減少被判作弊風險,同時也減少權(quán)重分散。
二級域名處理
分地區(qū)的二級域名也會遇到類似的情況,一定要讓內(nèi)容不一樣,否則會被K的風險。
一些測試用的二級域名如果不及時屏蔽蜘蛛,后期不用這些二級域名了,刪除快照參考文章《徹底屏蔽已收錄的不需要的二級域名有效方法》
差別不是很大的頁面處理
機械設(shè)備網(wǎng)站每種產(chǎn)品有可能只是圖片、參數(shù)、尺寸不一樣,其他內(nèi)容、布局是一樣的,這個也很傷腦筋,可以參考淘寶的方式,這類產(chǎn)品可以放到一個頁面,用戶可以挑選購買。當然如果沒有購買功能,根本沒必要區(qū)分那么多參數(shù)。
有些CMS管理就比較到位,內(nèi)容頁模板隨機選用,多寫幾個模板,對html標簽、title、keywords、description進行區(qū)分,也能降低相似度過高的風險。
內(nèi)容被盜用、復(fù)制的處理
網(wǎng)友辛苦些的文章,被一些權(quán)重高的網(wǎng)站盜用了,還不留版權(quán),這個是非常惱火的事情。聯(lián)系那些不勞而獲的站長,心情好的時候會刪除或者給你加上版權(quán),但絕大多數(shù)是做楊白勞。
很多時候你網(wǎng)站上的原創(chuàng)文章還不如別人盜用的排名還高,這是正,F(xiàn)象,雖然百度現(xiàn)在極力宣傳自己的原創(chuàng)版權(quán)保護,但仍處于內(nèi)測階段。
如果按照評判標準,應(yīng)該和線下版權(quán)程序類似:
①相關(guān)出處證明
如有自己特有的標簽、網(wǎng)站鏈接、網(wǎng)站名,就能證明這是你寫的文章;
②提交時間
現(xiàn)在百度鏈接提交內(nèi)容途徑比較豐富,但最直接的還是主動推送、自動推送,具體實現(xiàn)方法請參考官方說明,也可參考文章《新網(wǎng)站快速提高SEO索引量文章鏈接推送到百度》;
③蜘蛛的爬行時間
蜘蛛有時候勤快的爬取內(nèi)容,但及時放出快照,這也是證明這些內(nèi)容早于某些抄襲網(wǎng)站。
增加抄襲、采集者的成本
對付這類抄襲,一般只能通過JS禁止復(fù)制、禁用右鍵、封對方的IP等實現(xiàn),這些僅限于低級的抄襲,會用采集工具的就沒轍了,只要能查看源代碼,什么都不是問題...
我們只能做到增加對方的采集成本,比如圖片增加自己的水印,對方簡單粗暴的覆蓋你的水印可以會讓網(wǎng)友懷疑內(nèi)容真實性。
盡量把CSS樣式引用的方式,對方復(fù)制過去如果他沒寫好,是很難看的,比如在行內(nèi)樣式可以讓字體非常小,造成正常閱讀困難,但在樣式表里增加 !important 控制正常閱讀大小,具體實現(xiàn)方法自己琢磨或者咨詢我。