標(biāo)簽:
關(guān)于VBS采集,網(wǎng)上流行比較多的方法都是正則,其實 htmlfile 可以解析 html 代碼,但如果 designMode 沒開啟的話,有時候會包安全提示信息。
但是開啟 designMode (@預(yù)言家晚報 分享的方法) 的話,所有js都不會被執(zhí)行,只是干干凈凈的dom文檔,所以在逼不得已的情況下開啟 designMode 一般情況保持默認(rèn)即可。
Set html = CreateObject("htmlfile") Set http = CreateObject("Msxml2.ServerXMLHTTP") html.designMode = "on" ‘ 開啟編輯模式 http.open "GET", "http://www.cnblogs.com/", False http.send strHtml = http.responseText html.write strHtml ‘ 寫入數(shù)據(jù) Set post_list = html.getElementById("post_list") For Each el In post_list.children WScript.Echo el.getElementsByTagName("a")(0).innerText Next
其實方法很簡單,但是重點(diǎn)是會vbs的,卻不一定都會 dom 操作,所以這個很糾結(jié)。
我也沒辦法,只能靠你們自己了,我只是分享一下思路而已、
這樣解析 html 比正則方便快捷多了。
昨天說了下用 htmlfile 來解析 html,今天依然用他來解析,htmlfile 是一個 COM 版的 BOM 和 DOM,所以解析 html, 執(zhí)行 js 完全不在話下,
今天就繼續(xù)解析 json 和 jsonp 吧。
我收集了三種常見 json jsonp 的格式,因為很多人找我說如何用正則提取某個字符串,我看了下,要么是json,要么是jsonp,
正則簡直浪費(fèi),比如那種空間里說說的數(shù)據(jù),上百條的信息,你正則個P,而且還有回復(fù)里的格式也差不多的,所以最好的方法還是解析。
先來看看常見的三種吧:
酷我音樂用戶信息 json 格式
http://kzone.kuwo.cn/mlog/UserVal?uid=1237357&from=profile
{"work":4,"fans":275,"lp":"{\"id\":1237357,\"username\":\"亂碼\",\"pic\":\"http://img3.kuwo.cn/star/userhead/57/55/1315554310390_1237357m.jpg\"}","art":4,"album":1,"fortune":342402,"article":0,"workVideo":1,"care":195,"workAudio":3,"view":1312997,"playlist":0,"listen":278962,"collect":1}
拍拍手機(jī)查詢接口 jsonp 格式
http://virtual.paipai.com/extinfo/GetMobileProductInfo?mobile=13012345678&amount=10000&callname=cb
cb({mobile:‘13012345678‘,province:‘重慶‘,isp:‘中國聯(lián)通‘,stock:‘1‘,amount:‘10000‘,maxprice:‘0‘,minprice:‘0‘});
搜狐IP信息 js 格式
var returnCitySN = {"cip": "218.72.14.14", "cid": "330100", "cname": "浙江省杭州市"};
這幾種合適都可以通過 htmlfile 來解析,但是方法稍微有點(diǎn)差異。
先來解析第一種 json 格式的吧。
Set html = CreateObject("htmlfile") Set http = CreateObject("Msxml2.ServerXMLHTTP") http.open "GET", "http://kzone.kuwo.cn/mlog/UserVal?uid=1237357&from=profile", False http.send strHtml = http.responseText ‘ 得到數(shù)據(jù) Set window = html.parentWindow window.execScript "var json = " & strHtml, "JScript" ‘ 解析 json Set kuwo = window.json ‘ 獲取解析后的對象 WScript.Echo "訪問量:", kuwo.view, " 財富:", kuwo.fortune
可以得到如下信息。
再來看看 jsonp 的解析,jsonp其實只是多了一個回調(diào)函數(shù)而已,所以我們自定義一個函數(shù)解析他就可以了。
Set html = CreateObject("htmlfile") Set http = CreateObject("Msxml2.ServerXMLHTTP") callback = "cb" url = "http://virtual.paipai.com/extinfo/GetMobileProductInfo?mobile=13012345678&amount=10000&callname=" & callback http.open "GET", url, False http.send strHtml = http.responseText ‘ 得到數(shù)據(jù) ‘ cb({mobile:‘13012345678‘,province:‘重慶‘,isp:‘中國聯(lián)通‘,stock:‘1‘,amount:‘10000‘,maxprice:‘0‘,minprice:‘0‘}); ‘ <!--[if !IE]>|xGv00|8030d7c308afc4a32846a715ff79e9a3<![endif]--> ‘ 得到的是這樣的數(shù)據(jù),所以要處理下 strHtml = Split(strHtml, vbLf)(0) ‘ 取第一行 Set window = html.parentWindow window.execScript "function " & callback & "(o){json=o}", "JScript" ‘ jsonp 回調(diào)函數(shù)、 window.execScript strHtml, "JScript" ‘ 解析 json Set json = window.json ‘ 獲取解析后的對象 WScript.Echo json.mobile, json.isp, json.province
可以得到如下信息。
最后看下 js 格式解析,這個是最簡單的,什么都不用做,但是你要知道他的變量名。
Set html = CreateObject("htmlfile") Set http = CreateObject("Msxml2.ServerXMLHTTP") http.open "GET", "http://pv.sohu.com/cityjson", False http.send strHtml = http.responseText ‘ 得到數(shù)據(jù) ‘ 得到 var returnCitySN = {"cip": "218.72.14.14", "cid": "330100", "cname": "浙江省杭州市"}; Set window = html.parentWindow window.execScript strHtml, "JScript" ‘ 解析 js Set js = window.returnCitySN ‘ 獲取解析后的對象 WScript.Echo js.cname, js.cip, js.cid
可以得到如下信息。
js 格式的是最簡單的,但要注意,變量名是他定的,所以你在 獲取解析后的對象 那一步,要寫上他的變量名。
json 格式,我們只要給他加上變量名然后解析即可。
jsonp 相對麻煩點(diǎn),因為要寫一個自定義回調(diào)函數(shù)。
總的來說,方法差不多,只是解析部分稍微有點(diǎn)不同而已。
用 htmlfile 解析,是不是比 正則 方便?
以后玩 POST 別再用落伍的 instr+mid 或者 正則 去解析 html json了, htmlfile 才是王道。
標(biāo)簽:
聯(lián)系客服