簡述
Base64是一種用64個(gè)字符來表示任意二進(jìn)制數(shù)據(jù)的方法。
Base64編碼可以成為密碼學(xué)的基石??梢詫⑷我獾亩M(jìn)制數(shù)據(jù)進(jìn)行Base64編碼。所有的數(shù)據(jù)都能被編碼為并只用64個(gè)字符就能表示的文本文件。( 64字符:A~Z a~z 0~9 + / = )編碼后的數(shù)據(jù)~=編碼前數(shù)據(jù)的4/3,會(huì)大1/3左右。
Base64編碼的原理
將所有字符轉(zhuǎn)化為ASCII碼。
將ASCII碼轉(zhuǎn)化為8位二進(jìn)制 。
將二進(jìn)制3個(gè)歸成一組(不足3個(gè)在后邊補(bǔ)0)共24位,再拆分成4組,每組6位。
統(tǒng)一在6位二進(jìn)制前補(bǔ)兩個(gè)0湊足8位。
將補(bǔ)0后的二進(jìn)制轉(zhuǎn)為十進(jìn)制。
從Base64編碼表獲取十進(jìn)制對(duì)應(yīng)的Base64編碼。
Base64編碼的說明
轉(zhuǎn)換的時(shí)候,將三個(gè)byte的數(shù)據(jù),先后放入一個(gè)24bit的緩沖區(qū)中,先來的byte占高位。
數(shù)據(jù)不足3byte的話,于緩沖區(qū)中剩下的bit用0補(bǔ)足。然后,每次取出6個(gè)bit,按照其值選擇查表選擇對(duì)應(yīng)的字符作為編碼后的輸出。
不斷進(jìn)行,直到全部輸入數(shù)據(jù)轉(zhuǎn)換完成。
如果最后剩下兩個(gè)輸入數(shù)據(jù),在編碼結(jié)果后加1個(gè)“=”。
如果最后剩下一個(gè)輸入數(shù)據(jù),編碼結(jié)果后加2個(gè)“=”。
如果沒有剩下任何數(shù)據(jù),就什么都不要加,這樣才可以保證資料還原的正確性。
Python的Base64使用
Python內(nèi)置的base64模塊可以直接進(jìn)行base64的編解碼
注意:用于base64編碼的,要么是ASCII包含的字符,要么是二進(jìn)制數(shù)據(jù)
In [1]: import base64
In [2]: base64.b64encode(b'hello world')
Out[2]: b'aGVsbG8gd29ybGQ='
In [3]: base64.b64decode(b'aGVsbG8gd29ybGQ=')
Out[3]: b'hello world'
聯(lián)系客服