目前完全防止資料被采集而又沒(méi)有副作用的方法還沒(méi)有,下面3種方法在一定程度上能防止被采集,各有各的優(yōu)點(diǎn),也有缺陷。
一、建立多個(gè)模板 并隨機(jī)調(diào)用
優(yōu)點(diǎn):此方法比較實(shí)用,可大大增加采集難度。不過(guò)采集者執(zhí)意要采集,也不是沒(méi)有辦法。只是需要花上大量的時(shí)間來(lái)整理采集規(guī)則。
缺點(diǎn):此方法實(shí)現(xiàn)有點(diǎn)難度。1.需要制作多個(gè)模板 2.需要修改程序來(lái)隨機(jī)調(diào)用模板。
二、建立采集者IP庫(kù)
優(yōu)點(diǎn):此方法也比較簡(jiǎn)單,也比較實(shí)用。
缺點(diǎn):此方法屬于亡羊補(bǔ)牢型,還需搜集采集者的IP地址。此方法也還有一個(gè)缺點(diǎn):對(duì)動(dòng)態(tài)IP采集者幾乎無(wú)效。采集者有很多都是用火車頭之類的采集軟件來(lái)進(jìn)行采集,再導(dǎo)入網(wǎng)站數(shù)據(jù)庫(kù)的。而采集者大多都是動(dòng)態(tài)IP或者在網(wǎng)吧進(jìn)行采集。此方法雖然很被動(dòng),不過(guò)也不失為一種防采集的方法。
三、使用魚(yú)羊防采集控件
優(yōu)點(diǎn):此控件使用比較簡(jiǎn)單,也比較實(shí)用,而且完全免費(fèi),只需在原網(wǎng)頁(yè)代碼中加入幾行代碼就可對(duì)網(wǎng)頁(yè)源代碼進(jìn)行防采集處理,很大程度上對(duì)采集起到干擾作用。
缺點(diǎn):需要注冊(cè)控件,如果是虛擬空間則沒(méi)辦法使用。
認(rèn)識(shí)幾個(gè)做小說(shuō)站的朋友,他們的小說(shuō)站經(jīng)常被wap站點(diǎn)采集,最嚴(yán)重的時(shí)候采的服務(wù)器都癱瘓掉了。對(duì)于采集者也是沒(méi)什么主動(dòng)有效的辦法,只能靠封IP來(lái)解決。