第二步:采集內(nèi)容規(guī)則
打開任意的目標(biāo)站的內(nèi)容頁,找到標(biāo)題、作者、來源、發(fā)布時間、正文內(nèi)容對應(yīng)的特征代碼片段。獲取方式和前面審查元素一樣,最后測試一下目標(biāo)內(nèi)容頁能否正常采集。
第三步:發(fā)布內(nèi)容設(shè)置
①這里選擇啟用方式一:web在線發(fā)布到網(wǎng)站
剛開始添加發(fā)布配置的是空的,需要點擊“Web發(fā)布配置管理”。
在彈出的對話框內(nèi),新建一個發(fā)布模塊。跟一定要填寫好根目錄地址
http://127.0.0.1/lvshi/
②設(shè)置網(wǎng)站自動登陸(難點)
上圖的第四個紅框就是自動登陸設(shè)置,采取的是URL抓包的方法,繼續(xù)往下看。
打開Fiddler,如果軟件左側(cè)很多url,可以按Ctrl+X刪除,建議把瀏覽器其他無關(guān)的頁面關(guān)閉?梢钥吹紽iddler工具里面會顯示當(dāng)前web的數(shù)據(jù),由于是在本地測試,DedeCMS安裝在htdocs的lvshi目錄下,完整路徑是
E:\APMServ5.2.6\www\htdocs\lvshi\dede\
找到相應(yīng)的登陸url,點擊
http://127.0.0.1/lvshi/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php
點擊右側(cè)的Inspectors按鈕,顯示代碼如下(每個人的都不一樣)。
分別復(fù)制下面紅色的字體部分,填寫到對應(yīng)文本框內(nèi)
User-Agent(User-Agent后面代碼):Mozilla/5.0(windows NT 10.;WOW64)...(此處代碼省略) 登陸地址后綴(GET:后面代碼):/dede/login.php 來源地址后綴(Referer:后面代碼):/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php 粘貼抓包獲取的數(shù)據(jù)(Cookie:后面代碼):CNZZDATA1000250736=2025245578-1461249721-http%253A%252F%252F127.0.0.1%252F%7C1461299919;..(此處代碼省略)
把雙擊用戶名、密碼、驗證碼等,在彈出的對話框內(nèi),把對應(yīng)的值替換成對應(yīng)的標(biāo)簽。
用默認(rèn)的標(biāo)簽進(jìn)行替換規(guī)則,一般有[用戶名]、[密碼]、[驗證碼]等。
最后填寫自定義的系統(tǒng)命名及版本號,保存模塊即可。