為什么在ASP里指定了codepage為65001還經常顯示亂碼。才子在這里將這個問題詳細解釋一下,以免很多朋友再走彎路,甚至排斥UTF-8。
如果你還不知道UTF-8是什么東東,那才子建議你先去搜索一下UTF-8的相關資料吧。
UTF-8編碼之所以被越來越多的人接受甚至喜歡,肯定是有道理的,在WEB2.0盛行的今天,在大談多瀏覽器兼容的同時,不得不想到字符編碼不同所造成的亂碼現(xiàn)象同樣需要得到很好的處理.....
在N年以前,IE6以下的所有版本,只要沒有安裝相應的字庫,訪問相關的頁面都是會亂碼的,例如,我是IE5 (Windows2000默認) 的版本,在沒有安裝IE繁體字庫的情況下,訪問任何繁體頁面的網站都是會亂碼的,當然前提是該頁面采用了BIG5的Charset,而UTF-8作為一種國際編碼就能很好的處理該問題,只要將頁面存為UTF-8編碼格式,再在頁面上將codepage及charset全部定義為utf-8就可以在任何客戶端瀏覽器中顯示出完全正確的內容,完全不會亂碼......
好了,這里以ASP頁面為例,以一個實例來看具體操作吧:
打開新建一個ASP頁面,相信玩ASP的朋友都會留意到,許多下載的源碼里,頁面最上方一般都有一句:
%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%
前面的language應該不用多說了,vbscript就是ASP默認的腳本語言,其實完全可以不用寫,寫了好像還會影響頁面執(zhí)行效率,在這里我們先不討論這個問題。后面的codepage就是關鍵了,目的就是告訴瀏覽器,此頁面是何種編碼,936代表是簡體中文,而950代表繁體中文,65001就是我們今天說的UTF-8編碼了。我們將936改成65001。整句如下:
%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%
再加上輸出幾個中文字看看能不能正確顯示吧。
< %
Response.Write "第一次測試UTF-8頁面"
%>
OK,直接點擊“保存”,執(zhí)行這個頁面看看,如果不出意外,大家可能看到顯示出的是 “一尾UTF-8頁”這幾個字,中文有亂碼的現(xiàn)象,什么原因呢?
OK,請大家再點擊最上面的 "文件" 菜單,選擇"另存為",最下面一行有個編碼,默認應該是ANSI的,請大家點下拉框,選擇UTF-8,再點保存,再執(zhí)行試試看,如果不出意外,亂得更厲害了,呵呵,暈了吧。別急,想想原因,因為我們做的頁面是HTML返回的,以前我們寫HTML時,看到body前面,也就是head里都有一句meta,應該是這樣的:
< meta http-equiv="Content-Type" content="text/html; charset=gb2312" >
也就是指定頁面以gb2312編碼返回結果,一定要寫在有返回結果輸出的前面。大家都知道gb2312是簡體中文吧,我們今天說的是UTF-8編碼,我們就將gb2312改成UTF-8吧,全部代碼如下:
< %@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
< meta http-equiv="Content-Type" content="text/html; charset=utf-8">
< %
Response.Write "第一次測試UTF-8頁面"
%>
再執(zhí)行看看,嗯,這次正常顯示了吧.......
結論:采用UTF-8編碼,除了要將文件另存為UTF-8格式之外,還需要同時指定codepage及charset。