vbs結(jié)合wget 實(shí)現(xiàn)下載網(wǎng)站圖片
vbs 函數(shù)過程:
1. 調(diào)用wget: 下載網(wǎng)站所有頁面到本腳本目錄 ……
2. 掃描本腳本目錄中所有文件 ……
3. 讀取本腳本目錄中的所有網(wǎng)頁,匹配圖片 URL 地址 ……
4. 保存所有圖片 URL 地址到 url-img.txt 文件 ……
5. 調(diào)用wget: 下載 url-img.txt 指定的圖片到本腳本 img 目錄 ……
' wget_img.vbs Call Main() Sub Main() ' CMD 模式 If Not (LCase(Right(WScript.FullName,11)) = LCase("CScript.exe")) Then CreateObject("WScript.Shell").Run "cscript.exe //nologo """ & WScript.ScriptFullName & """", 1, False WScript.Quit(1) End If Dim wso, strMeDir Set wso = WScript.CreateObject("WScript.Shell") strMeDir = Left(WScript.ScriptFullName, InStrRev(WScript.ScriptFullName,"\")-1) ' 啟動(dòng) wget下載網(wǎng)站所有頁面到本腳本目錄的 720.hao2046.net 文件夾 WScript.Echo "1. 啟動(dòng) wget下載網(wǎng)站所有頁面到本腳本目錄的 720.hao2046.net 文件夾 ……" wso.Run "wget -r -p -k -c -x -A=jpg,htm,html 720.hao2046.net -P """ & strMeDir & """", 1, True ' 掃描 720.hao2046.net 文件夾中所有文件 WScript.Echo "2. 掃描 720.hao2046.net 文件夾中所有文件 ……" Dim strFolderspec, strHTML, strURL Dim arr() : ReDim Preserve arr(0) strFolderspec = strMeDir & "\720.hao2046.net" Call ScanFolder(arr, strFolderspec) ' 建立正則表達(dá)式。 Dim regEx Set regEx = CreateObject("VBScript.RegExp") ' 建立正則表達(dá)式。 regEx.IgnoreCase = True ' 設(shè)置是否區(qū)分大小寫。 regEx.Global = True ' 設(shè)置全局替換。 regEx.MultiLine = True ' 設(shè)置多行匹配模式 ' 查找所有文件 WScript.Echo "3. 讀取 720.hao2046.net 文件夾中的所有網(wǎng)頁,匹配圖片 URL 地址 ……" For i = 0 To UBound(arr) If LCase(Right(arr(i),5)) = ".html" Or LCase(Right(arr(i),4)) = ".htm" Then ' 讀取文件,匹配圖片 URL 地址 strHTML = ReadPfile(arr(i), "gb2312") regEx.Pattern = "src=['""]http://\S+\.jpg['""]" Set Matches = regEx.Execute(strHTML) ' 執(zhí)行搜索。 For Each Match in Matches ' 遍歷匹配集合。 If Not Match.Value = "" Then regEx.Pattern = "(src=['""])*(['""])*" strURL = strURL & regEx.Replace(Match.Value, "") & vbCrLf End If Next End If Next ' 保存所有圖片 URL 地址 WScript.Echo "4. 保存所有圖片 URL 地址到 url-img.txt 文件 ……" Call SavePfile(strMeDir & "\url-img.txt", "utf-8", strURL) ' 啟動(dòng) wget 下載圖片到本腳本 img 目錄 WScript.Echo "5. 啟動(dòng) wget 下載 url-img.txt 指定的圖片到本腳本 img 目錄 ……" wso.Run "wget -c -x -t 5 -i """ & strMeDir & "\url-img.txt"" -P """ & strMeDir & "\img""", 1, True Msgbox "完成!" End Sub '=========================================================================================== '按編碼讀取txt文件內(nèi)容 Function ReadPfile(ByVal FileName, ByVal FileCode) Dim objStream Set objStream = CreateObject("ADODB.Stream") ' With objStream .Type = 2 .Mode = 3 .open .Charset = FileCode '不同編碼時(shí)自己換,Chinese (Simplified) (GB2312),中文 GBK ,繁體中文 Big5 ,日文 EUC-JP ,韓文 EUC-KR,charset=UTF-8(國(guó)際化編碼),ANSI,Unicode,unicode big endian .LoadFromFile FileName ReadPfile = .ReadText .Close End With Set objStream = Nothing End Function '=========================================================================================== '保存文件為unicode格式文本 Function SavePfile(ByVal FileName, ByVal FileCode, ByVal TextString) Dim objStream Set objStream = CreateObject("ADODB.Stream") With objStream .Type = 2 .Mode = 3 .Charset = FileCode '不同編碼時(shí)自己換,Chinese (Simplified) (GB2312),中文 GBK ,繁體中文 Big5 ,日文 EUC-JP ,韓文 EUC-KR,charset=UTF-8(國(guó)際化編碼),ANSI,Unicode,unicode big endian .open .WriteText TextString .SaveToFile FileName, 2 .Close End With Set objStream = Nothing End Function ' Dim arr() : ReDim Preserve arr(0) ' Call ScanFolder(arr, "V:\") Sub ScanFolder(ByRef arr, ByVal strFolderspec) On Error Resume Next Dim fso, objFolder Set fso = Createobject("Scripting.FileSystemObject") Set objFolder = fso.getfolder(strFolderspec) ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = strFolderspec & "\" For Each subFile In objFolder.files ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = subFile.path Next For Each subFolder In objFolder.subfolders ScanFolder arr, subFolder.path Next Set fso = NoThing Set objFolder = NoThing End Sub
附網(wǎng)頁文件查找字符串代碼(findstr_html.vbs):
' findstr_html.vbs Call Main() Sub Main() ' CMD 模式 If Not (LCase(Right(WScript.FullName,11)) = LCase("CScript.exe")) Then CreateObject("WScript.Shell").Run "cscript.exe //nologo """ & WScript.ScriptFullName & """", 1, False WScript.Quit(1) End If Dim strMeDir strMeDir = Left(WScript.ScriptFullName, InStrRev(WScript.ScriptFullName,"\")-1) Dim regEx, strHTML, strURL ' 掃描文件夾 Dim arr() : ReDim Preserve arr(0) Call ScanFolder(arr, strMeDir & "\720.hao2046.net") If UBound(arr) = 0 Then WScript.Echo strMeDir & "\720.hao2046.net" & ", Not Found!" Exit Sub End If ' 建立正則表達(dá)式。 Set regEx = CreateObject("VBScript.RegExp") ' 建立正則表達(dá)式。 regEx.IgnoreCase = True ' 設(shè)置是否區(qū)分大小寫。 regEx.Global = True ' 設(shè)置全局替換。 regEx.MultiLine = True ' 設(shè)置多行匹配模式 Do strPattern = InputBox("請(qǐng)輸入要匹配的正則表達(dá)式:","查找所有網(wǎng)頁文件","123456") strInfo = strPattern & vbCrLf & "Not Found!" For i = 0 To UBound(arr) If LCase(Right(arr(i),5)) = ".html" Or LCase(Right(arr(i),4)) = ".htm" Then 'WScript.Echo arr(i) strHTML = ReadPfile(arr(i), "gb2312") If InStr(strHTML, strPattern)>0 Then strInfo = strPattern & vbCrLf & arr(i) & vbCrLf Exit For Else 'regEx.Pattern = "src=['""]http://\S+\.jpg['""]" regEx.Pattern = strPattern Set Matches = regEx.Execute(strHTML) ' 執(zhí)行搜索。 For Each Match in Matches ' 遍歷匹配集合。 If Not Match.Value = "" Then 'regEx.Pattern = "(src=['""])*(['""])*" 'strURL = strURL & regEx.Replace(Match.Value, "") & vbCrLf strInfo = strPattern & vbCrLf & arr(i) & vbCrLf Exit For End If Next End If End If Next WScript.Echo strInfo Loop End Sub '=========================================================================================== '按編碼讀取txt文件內(nèi)容 Function ReadPfile(ByVal FileName, ByVal FileCode) Dim objStream Set objStream = CreateObject("ADODB.Stream") ' With objStream .Type = 2 .Mode = 3 .open .Charset = FileCode '不同編碼時(shí)自己換,Chinese (Simplified) (GB2312),中文 GBK ,繁體中文 Big5 ,日文 EUC-JP ,韓文 EUC-KR,charset=UTF-8(國(guó)際化編碼),ANSI,Unicode,unicode big endian .LoadFromFile FileName ReadPfile = .ReadText .Close End With Set objStream = Nothing End Function ' Dim arr() : ReDim Preserve arr(0) ' Call ScanFolder(arr, "V:\") Sub ScanFolder(ByRef arr, ByVal strFolderspec) On Error Resume Next Dim fso, objFolder Set fso = Createobject("Scripting.FileSystemObject") Set objFolder = fso.getfolder(strFolderspec) ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = strFolderspec & "\" For Each subFile In objFolder.files ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = subFile.path Next For Each subFolder In objFolder.subfolders ScanFolder arr, subFolder.path Next Set fso = NoThing Set objFolder = NoThing End Sub
提示:
1. 警告:請(qǐng)不要直接運(yùn)行代碼,這里的示范網(wǎng)址可能無法訪問、或缺乏安全性,請(qǐng)改為其他網(wǎng)址再使用。
2. 請(qǐng)將 wget.exe 放置于腳本同一目錄下,然后執(zhí)行。文件結(jié)構(gòu)如下:
..\wget.exe
..\wget_img.vbs
..\findstr_html.vbs
上一篇:VB使用XMLHTTP實(shí)現(xiàn)Post與Get的方法
欄 目:vb
下一篇:Vbs腳本經(jīng)典教材(最全的資料還是MSDN)
本文標(biāo)題:vbs結(jié)合wget 實(shí)現(xiàn)下載網(wǎng)站圖片
本文地址:http://mengdiqiu.com.cn/a1/vb/7209.html
您可能感興趣的文章
- 01-10下載文件到本地運(yùn)行的vbs
- 01-10VBS中的正則表達(dá)式的用法大全 <font color=red>原創(chuàng)&
- 01-10VBS中SendKeys的基本應(yīng)用
- 01-10VBScript教程 第十一課深入VBScript
- 01-10用VBSCRIPT控制ONSUBMIT事件
- 01-10VBScript語法速查及實(shí)例說明
- 01-10VBS中Select CASE的其它用法
- 01-10VBScript教程 第七課使用條件語句
- 01-10vbscript 可以按引用傳遞參數(shù)嗎?
- 01-10VBScript教程 第二課在HTML頁面中添加VBscript代碼


閱讀排行
- 1C語言 while語句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹的示例代碼(圣誕
- 3利用C語言實(shí)現(xiàn)“百馬百擔(dān)”問題方法
- 4C語言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 01-10下載文件到本地運(yùn)行的vbs
- 01-10飄葉千夫指源代碼,又稱qq刷屏器
- 01-10SendKeys參考文檔
- 01-10什么是一個(gè)高效的軟件
- 01-10VBS中的正則表達(dá)式的用法大全 &l
- 01-10exe2swf 工具(Adodb.Stream版)
- 01-10VBS中SendKeys的基本應(yīng)用
- 01-10用VBSCRIPT控制ONSUBMIT事件
- 01-10VBScript教程 第十一課深入VBScript
- 01-10VBScript語法速查及實(shí)例說明
隨機(jī)閱讀
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-10使用C語言求解撲克牌的順子及n個(gè)骰子
- 01-10C#中split用法實(shí)例總結(jié)
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 01-10delphi制作wav文件的方法
- 04-02jquery與jsp,用jquery
- 01-11ajax實(shí)現(xiàn)頁面的局部加載
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改