字元串编码及Python字元串编码

1、字元与位元组有什么区别

（一）位元组

位元组（Byte）是一种计量单位，表示数据量多少，主要用于存储和网路传输。1 byte=8 bit （KB,M）

（二）字元

字元是指计算机中使用的文字和符号，比如1、2、3、A、B、C、~！·#￥%……

（三）「位元组」与「字元」

它们完全不是一个位面的概念，不同编码里，字元和位元组的对应关系不同：

①ASCII码中，一个英文字母（不分大小写）占一个位元组的空间，一个中文汉字占两个位元组的空间。一个二进位数字序列，在计算机中作为一个数字单元，一般为8位二进位数，换算为十进位。最小值0，最大值255。

②UTF-8编码中，一个英文字元=一个位元组，一个中文（含繁体）=三个位元组。

③Unicode编码中，一个英文等于=两位元组，一个中文（含繁体）=两个位元组。

符号：英文标点占一个位元组，中文标点占两个位元组。举例：英文句号「.」占1个位元组的大小，中文句号「。」占2个位元组的大小。

格式化