台湾 || 语言: 大陆简体港澳繁體台灣正體

Unicode 编码及 UTF-32, UTF-16 和 UTF-8

雪花台湾 2019-03-22 22:36

本文用非常便于理解的方式和语言介绍了 UNICODE 编码及其实现，包含 UTF-32, UTF-16 和 UTF-8。这是我以前记得一篇笔记，我将其通俗、细化了，以方便大家理解。此文章中的描述，很多都是我自己想出来的。还有，大家看的时候，不要纠结名词的翻译，名词后边，都是带上英文了的。

目　录

字符集编码（Character Encoding）
平面（Plane）
Unicode 的实现

UTF-32
UTF-16
UTF-8

位元组顺序标记（BOM）
Unicode 的其他属性
查看三种实现的 JavaScript 代码

字符集编码（Character Encoding）

计算机的位只有两种状态，1 和 0，也就是说，在计算机中，只有数字。这些数字，要执行成代码，就得对命令编码；要显示出颜色，就得对颜色编码；要显示成文字，就得对文字编码。

对命令编码：比如汇编语言；对颜色编码：比如 CSS 用的 24 位色 RGB。对字元编码：通俗的讲，就是规定哪个数字代表哪个字元。比如在 GB 18030 中，规定 B0A1 代表字元「啊」。

相关文章