台湾 || 语言: 大陆简体港澳繁體台灣正體

一篇文章助你理解Python3中字元串編碼問題

雪花臺灣 2019-02-23 12:50

前幾天給大家介紹了unicode編碼和utf-8編碼的理論知識，以及Python2中字元串編碼問題，沒來得及上車的小夥伴們可以戳這篇文章：淺談unicode編碼和utf-8編碼的關係和一篇文章助你理解Python2中字元串編碼問題。下面在Python3環境中進行代碼演示，分別Windows和Linux操作系統下進行演示，以加深對字元串編碼的理解。

在Python2的Python文件的文件頭往往會聲明字元的編碼格式，通過會使用代碼「#-*- coding -*-」作為編碼聲明，如下圖所示。

因為考慮到Python文件中可能會穿插中文，不然的話Python通過解釋器來讀取文件的時候，文件中的中文就有可能識別不了。而在Python3中，我們就不必像Python2的文件那樣進行聲明編碼格式了，因為在Python3中，默認將所有的字元都視為unicode格式了。下面在Python3環境下進行代碼演示。

1、首先在Windows操作系統下的Python3環境中進行演示，如下圖所示。

可以看到str1就是一個中文的字元串，字元串前面也沒有加u以表示其為unicode編碼，其實也沒有必要加那個字元，因為在Python3中將所有的字元都內置成unicode字元了，這就是Python2和Python3最大的區別。所有在這裡可以直接調用encode()函數對字元串進行編碼，而且也不會報錯。

2、接下來在Linux操作系統下的Python3環境中進行演示，如下圖所示。

這個過程和Windows下是一樣的，這裡就不再贅述了。有個地方需要注意的是在Linux操作系統下，Python3的默認環境編碼變為了utf-8編碼，而不是Python2中的ASCII編碼。

總的來說，Python3解決了一個字元串編碼的重要問題，所以在字元串編碼的報錯方面相對Python2來說要少的多，幫助我們省下了很多事情。小夥伴們，關於在Python2和Python3中字元串的編碼問題這個知識點十分重要，希望大家都可以get到噢~~

推薦閱讀：

相關文章