• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當前位置: 首頁 - 科技 - 知識百科 - 正文

    如何解決遠程頁面抓取中的亂碼問題

    來源:懂視網 責編:小采 時間:2020-11-27 22:52:47
    文檔

    如何解決遠程頁面抓取中的亂碼問題

    如何解決遠程頁面抓取中的亂碼問題:由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。 ff提供了overrideMimeType方法,可以指定返回值
    推薦度:
    導讀如何解決遠程頁面抓取中的亂碼問題:由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。 ff提供了overrideMimeType方法,可以指定返回值

    由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。

      ff提供了overrideMimeType方法,可以指定返回值的編碼,所以解決起來比較簡單,只要把這個方法指向gb2312就可以了。對于IE,可以用vbs配合來作編碼轉換,用gb2utf8來轉換接收到的二進制數據,其中利用到execScript方法來調用vbs的函數。
    代碼如下:
    <body></body>
    <script>
    loadPage("index.htm")
    function loadPage(url){
        var xh=window.Event?new XMLHttpRequest():new ActiveXObject("Microsoft.XMLHTTP")
        xh.open("GET",url,true)
        if(window.Event)
            xh.overrideMimeType("text/xml;charset=gb2312")
        xh.onreadystatechange=function(){
            if(xh.readyState!=4)
                return
            var v
            v=window.Event?xh.responseText:window.gb2utf8(xh.responseBody)
            alert(v)
        }
        window.gb2utf8=function(data){
            var glbEncode=[],t,i,j,len
            gb2utf8_data=data
            execScript("gb2utf8_data = MidB(gb2utf8_data, 1)+' '", "vbscript")
            t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2")
            t=t.split("@")
            i=0
            len=t.length
            while(++i<len){
                j=t[i].substring(0,4)
                if(!glbEncode[j]) {
                    gb2utf8_char = eval("0x"+j)
                    execScript("gb2utf8_char=Chr(gb2utf8_char)","vbscript")
                    glbEncode[j]=escape(gb2utf8_char).substring(1,6)
                }
                t[i]=glbEncode[j]+t[i].substring(4)
            }
            gb2utf8_data=gb2utf8_char=null
            return unescape(t.join("%")).slice(0,-1)
        }
        xh.send(null)
    }
    </script>

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    如何解決遠程頁面抓取中的亂碼問題

    如何解決遠程頁面抓取中的亂碼問題:由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。 ff提供了overrideMimeType方法,可以指定返回值
    推薦度:
    標簽: 獲取 如何 亂碼
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 99久久久精品免费观看国产 | 国产国产精品人在线观看| 国产精品自拍一区| 亚洲色精品aⅴ一区区三区| 国产精品亚洲专区无码WEB| 精品人妻中文av一区二区三区| 国产亚洲精品自在线观看| 91麻豆精品视频在线观看| 中文国产成人精品久久不卡| 国产精品人人做人人爽| 99re这里只有精品国产精品| 亚洲精品午夜无码电影网| 九九热这里只有国产精品| 四虎国产精品永久地址49| 精品国际久久久久999波多野 | 国产福利电影一区二区三区,亚洲国模精品一区 | 国产精品视频第一区二区三区| 欧美日韩成人精品久久久免费看| 国内精品手机在线观看视频| 久久久久久国产精品无码超碰| 欧美精品一区二区三区免费观看| 国产精品高清在线| 久久伊人精品青青草原高清| 92国产精品午夜福利| 久久精品www人人爽人人| 一本久久精品一区二区| 久久久无码精品亚洲日韩软件| 国产精品视频免费一区二区| 久久久久久久99精品免费观看| 97久久精品国产精品青草| 精品国产AV一区二区三区| 久久精品国产亚洲AV电影 | 91精品国产91久久久久久青草 | 99在线精品一区二区三区| 国产精品多p对白交换绿帽| 人妻少妇精品视频二区| 亚洲精品无码久久久久去q| 无码国模国产在线无码精品国产自在久国产 | 国产精品99久久久久久猫咪| 香蕉久久夜色精品国产小说| 久久91精品国产91久久户|