字元串編碼及Python字元串編碼

1、字元與位元組有什麼區別

（一）位元組

位元組（Byte）是一種計量單位，表示數據量多少，主要用於存儲和網路傳輸。1 byte=8 bit （KB,M）

（二）字元

字元是指計算機中使用的文字和符號，比如1、2、3、A、B、C、~！·#￥%……

（三）「位元組」與「字元」

它們完全不是一個位面的概念，不同編碼裏，字元和位元組的對應關係不同：

①ASCII碼中，一個英文字母（不分大小寫）佔一個位元組的空間，一個中文漢字佔兩個位元組的空間。一個二進位數字序列，在計算機中作為一個數字單元，一般為8位二進位數，換算為十進位。最小值0，最大值255。

②UTF-8編碼中，一個英文字元=一個位元組，一個中文（含繁體）=三個位元組。

③Unicode編碼中，一個英文等於=兩位元組，一個中文（含繁體）=兩個位元組。

符號：英文標點佔一個位元組，中文標點佔兩個位元組。舉例：英文句號「.」佔1個位元組的大小，中文句號「。」佔2個位元組的大小。

格式化