在項(xiàng)目開發(fā)中不少朋友都會遇到字符串編碼、解碼或者編碼轉(zhuǎn)換的問題。
為了方便初學(xué)者朋友,我就在這里拋磚引玉地講解一下吧。
在C#中我們一般使用System.Text.Encoding來處理字符串編碼的問題。
1、字符串解碼
string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
有這么一段代碼,我們?nèi)绾伟阉D(zhuǎn)換成可識別的中文呢?
有經(jīng)驗(yàn)或?qū)Ω鞣N編碼比較熟悉的朋友可能直接就可以看出來,但是我們在不知道編碼的情況下如何快速把該編碼轉(zhuǎn)換為漢字呢?
string text = Encoding.UTF8.GetString(byte[] bytes);
在知道這是UTF8編碼的情況下我們可以通過GetString來進(jìn)行解碼。
不知道編碼其實(shí)我們可以通過遍歷的方式來窮舉一下就可以了:
- string sources = "C#是一門很優(yōu)雅的語言";
- string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
- foreach (var encoding in Encoding.GetEncodings())
- {
- string temp_code = string.Concat(encoding.GetEncoding().GetBytes(sources).Select(item => item.ToString("x").PadLeft(2, '0')));
- if (temp_code == code)
- {
- Console.WriteLine(temp_code);
- Console.WriteLine(encoding.Name);
- }
- }
如果沒有sources字符串,只有code編碼的時(shí)候也可以遍歷所有encoding,看看什么encoding可以輸出正常的中文即可。
或者在直接知道編碼的情況下:
- string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
- byte[] buffer = Regex.Matches(code, "[0-9a-fA-F]{2}").Cast<Match>().Select(item => Convert.ToByte(item.Value, 16)).ToArray();
- Console.WriteLine(Encoding.BigEndianUnicode.GetString(buffer));
2、字符串編碼
編碼就相對比較簡單了。
- string temp_code = string.Concat(encoding.GetEncoding().GetBytes(sources).Select(item => item.ToString("x").PadLeft(2, '0')));
我們上面的解碼過程中就是把字符串用各種編碼方式進(jìn)行編碼然后和已有的編碼比較。
3、編碼轉(zhuǎn)換
- byte[] buffer = Encoding.UTF8.GetBytes(sources);//可能是從其他地方獲取過來的參數(shù)
- buffer = Encoding.Convert(Encoding.UTF8/*原始編碼*/, Encoding.ASCII/*目標(biāo)編碼*/, buffer);
PS:
在web開發(fā)中可能經(jīng)常遇到的是url編碼、解碼的問題,或者url參數(shù)亂碼等等。。。
Server.UrlEncode("");
Server.UrlDecode("");
System.Web.HttpUtility.UrlEncode("");
System.Web.HttpUtility.UrlDecode("");
System.Uri.EscapeDataString("");
System.Uri.UnescapeDataString("");
通??梢允褂眠@些工具類來編碼、解碼。亂碼一般都是因?yàn)榘l(fā)送方和接收放使用的編碼不一致造成的,在解碼過程中加上正確的編碼即可。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。