濮阳杆衣贸易有限公司

主頁 > 知識(shí)庫 > vbs或asp采集文章時(shí)網(wǎng)頁編碼問題

vbs或asp采集文章時(shí)網(wǎng)頁編碼問題

熱門標(biāo)簽:電銷機(jī)器人采購 宿州防封外呼系統(tǒng)平臺(tái) 無營業(yè)執(zhí)照地圖標(biāo)注教學(xué) 地圖標(biāo)注還可以做嗎 滴滴地圖標(biāo)注上車點(diǎn) 友邦互聯(lián)電銷機(jī)器人違法嗎 硅基電話機(jī)器人加盟 外呼系統(tǒng)怎么話費(fèi) 高質(zhì)量的電銷外呼系統(tǒng)
'/*=========================================================================   
' * Intro       研究網(wǎng)頁編碼很長時(shí)間了,因?yàn)樽罱O(shè)計(jì)一個(gè)友情鏈接檢測的VBS腳本,而與你鏈接的人的頁面很可能是各種編碼,以前采取的方法是:如果用GB2312查不到再用UTF-8查,再找不到證明對(duì)方?jīng)]有給你做鏈接雖然不是100%正確,但也差不多了,這兩種編碼用的人比較多,偶然間在收藏夾里的一個(gè)地址看到的一個(gè)思路,終于可以在采集文章時(shí)自動(dòng)判斷網(wǎng)頁的編碼了。因?yàn)檠芯窟^程中這個(gè)問題困擾很久,雖然現(xiàn)在覺得簡單了,想必很多人還在找,所以把這三個(gè)函數(shù)貼出來。   
' * FileName    GetWebCodePage.vbs   
' * Author      yongfa365   
' * Version     v2.0   
' * WEB         http://www.yongfa365.com   
' * Email       yongfa365[at]qq.com   
' * FirstWrite  http://www.yongfa365.com/Item/GetWebCodePage.vbs.html   
' * MadeTime    2008-01-29 20:55:46   
' * LastModify  2008-01-30 20:55:46   
' *==========================================================================*/   

  
Call getHTTPPage("http://www.baidu.com/")   
Call getHTTPPage("http://www.google.com/")   
Call getHTTPPage("http://www.yongfa365.com/")   
Call getHTTPPage("http://www.cbdcn.com/")   
Call getHTTPPage("http://www.csdn.net/")   

  
'得到匹配的內(nèi)容,返回?cái)?shù)組   
'getContents(表達(dá)式,字符串,是否返回引用值)   
'msgbox getContents("a(.+?)b", "a23234b ab a67896896b sadfasdfb" ,True)(0)   

Function getContents(patrn, strng , yinyong)   
'by www.yongfa365.com 轉(zhuǎn)載請保留鏈接,以便最終用戶及時(shí)得到最新更新信息   
    On Error Resume Next  
    Set re = New RegExp  
    re.Pattern = patrn   
    re.IgnoreCase = True  
    re.Global = True  
    Set Matches = re.Execute(strng)   
    If yinyong Then  
        For i = 0 To Matches.Count -1   
            If Matches(i).Value>"" Then RetStr = RetStr  Matches(i).SubMatches(0)  "柳永法"  
        Next  
    Else  
        For Each oMatch in Matches   
            If oMatch.Value>"" Then RetStr = RetStr  oMatch.Value  "柳永法"  
        Next  
    End If  
    getContents = Split(RetStr, "柳永法")   
End Function  

Function getHTTPPage(url)   
    On Error Resume Next  
    Set xmlhttp = CreateObject("MSXML2.XMLHTTP")   
    xmlhttp.Open "Get", url, False  
    xmlhttp.Send   
    If xmlhttp.Status>200 Then Exit Function  
    GetBody = xmlhttp.ResponseBody   
    '柳永法(www.yongfa365.com)在此的思路是,先根據(jù)返回的字符串找,找文件頭,如果還沒有的話就用GB2312,一般都能直接匹配出編碼。   
    '在返回的字符串里看,雖然中文是亂碼,但不影響我們?nèi)∑渚幋a,   
    GetCodePage = getContents("charset=[""']*([^"",']+)", xmlhttp.ResponseText , True)(0)   
    '在頭文件里看編碼   
     If Len(GetCodePage)3 Then GetCodePage = getContents("charset=[""']*([^"",']+)", xmlhttp.getResponseHeader("Content-Type") , True)(0)   
    If Len(GetCodePage)3 Then GetCodePage = "gb2312"  
    Set xmlhttp = Nothing  
    '下邊這句在正式使用時(shí)要屏蔽掉   
    WScript.Echo url  "-->"  GetCodePage   
    getHTTPPage = BytesToBstr(GetBody, GetCodePage)   
End Function  

  
Function BytesToBstr(Body, Cset)   
    On Error Resume Next  
    Dim objstream   
    Set objstream = CreateObject("adodb.stream")   
    objstream.Type = 1   
    objstream.Mode = 3   
    objstream.Open  
    objstream.Write Body   
    objstream.Position = 0   
    objstream.Type = 2   
    objstream.Charset = Cset   
    BytesToBstr = objstream.ReadText   
    objstream.Close  
    Set objstream = Nothing  
End Function
您可能感興趣的文章:
  • php 判斷網(wǎng)頁是否是utf8編碼的方法
  • js 顯示base64編碼的二進(jìn)制流網(wǎng)頁圖片
  • Base64編碼加密JS代碼網(wǎng)頁版
  • 多種語言(big5\gbk\gb2312\utf8\Shift_JIS\iso8859-1)的網(wǎng)頁編碼切換解決方案歸納
  • ASP+FSO生成的網(wǎng)頁文件默認(rèn)編碼格式以及轉(zhuǎn)換成UTF-8編碼方法
  • ASP UTF-8編碼生成靜態(tài)網(wǎng)頁的函數(shù)
  • asp.net HttpWebRequest自動(dòng)識(shí)別網(wǎng)頁編碼
  • asp.net 網(wǎng)頁編碼自動(dòng)識(shí)別代碼
  • 網(wǎng)頁語言編碼及asp亂碼問題解決方案
  • 判斷網(wǎng)頁編碼的方法python版

標(biāo)簽:錫林郭勒盟 七臺(tái)河 儋州 廣元 新余 宣城 雅安 江門

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《vbs或asp采集文章時(shí)網(wǎng)頁編碼問題》,本文關(guān)鍵詞  vbs,或,asp,采集,文章,時(shí),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《vbs或asp采集文章時(shí)網(wǎng)頁編碼問題》相關(guān)的同類信息!
  • 本頁收集關(guān)于vbs或asp采集文章時(shí)網(wǎng)頁編碼問題的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    辛集市| 明光市| 永泰县| 宁夏| 利川市| 亚东县| 裕民县| 隆德县| 微博| 志丹县| 夹江县| 寻乌县| 浪卡子县| 鄂伦春自治旗| 邯郸市| 嘉鱼县| 南昌市| 蒙阴县| 会昌县| 托克托县| 开封市| 当阳市| 绍兴县| 汉川市| 杂多县| 周口市| 长兴县| 金湖县| 铁岭县| 文登市| 马山县| 胶州市| 宣化县| 临夏县| 云浮市| 佛冈县| 商水县| 新河县| 茂名市| 泰安市| 盖州市|