1.GBK包含GB2312,即如果通過GB2312編碼后可以通過GBK解碼,反之可能不成立;
2.java.nio.charset.Charset.defaultCharset() 獲得平臺默認字符編碼;
3.getBytes() 是通過平臺默認字符集進行編碼;
在學習任何一門技術時,經(jīng)常會有初學者遇到中文亂碼問題,比如MySQL,是因為在安裝時沒有設置;而在Servlet中,也會遇到中文亂碼問題;
比如:
OutputStream out = response.getOutputStream();
out.write(String );
輸出中文時可能會出現(xiàn)亂碼;
比如:
輸出亂碼的問題是程序用UTF-8編碼,而瀏覽器用GB2312解碼,因此會出現(xiàn)亂碼;
Servlet亂碼分為request亂碼和response亂碼;
在網(wǎng)上很有效的解決方法是添加:
response.setCharacterEncoding("UTF-8");
解決不了,后來又搜到一條解決方法是:
respnse.setHeader("content-type","text/html;charset=UTF-8");
兩句都填上,后來終于解決了這個問題;
其實我們應該思考一下本質(zhì);
我們這里先來說明一下錯誤的原因,下圖是顯示亂碼的流程圖:
response.setContentType("text/html;charset=UTF-8"); 目的是為了控制瀏覽器的行為,即控制瀏覽器用UTF-8進行解碼;
response.setCharacterEncoding("UTF-8"); 的目的是用于response.getWriter()輸出的字符流的亂碼問題,如果是response.getOutputStream()是不需要此種解決方案的;因為這句話的意思是為了將response對象中的數(shù)據(jù)以UTF-8解碼后發(fā)向瀏覽器;
解決方案流程圖:
瀏覽器輸出: ??
原因:"博客"首先被封裝在response對象中,因為IE和WEB服務器之間不能傳輸文本,然后就通過ISO-8859-1進行編碼,但是ISO-8859-1中沒有“博客”的編碼,因此輸出“??”表示沒有編碼;
而解決方案是:response.setCharacterEncoding("GB2312"); 設置response使用的碼表
<meta http-equiv="content-type" content="text/html"/> 等價于 response.setContentType("text/html");
request請求分為post和get,對于不同的請求方式有不同的解決亂碼的方案;
錯誤原因:
解決方案:
聯(lián)系客服