前幾天給大家介紹了unicode編碼和utf-8編碼的理論知識,以及Python2中字元串編碼問題,沒來得及上車的小夥伴們可以戳這篇文章:淺談unicode編碼和utf-8編碼的關係和一篇文章助你理解Python2中字元串編碼問題。下面在Python3環境中進行代碼演示,分別Windows和Linux操作系統下進行演示,以加深對字元串編碼的理解。

在Python2的Python文件的文件頭往往會聲明字元的編碼格式,通過會使用代碼「#-*- coding -*-」作為編碼聲明,如下圖所示。

因為考慮到Python文件中可能會穿插中文,不然的話Python通過解釋器來讀取文件的時候,文件中的中文就有可能識別不了。而在Python3中,我們就不必像Python2的文件那樣進行聲明編碼格式了,因為在Python3中,默認將所有的字元都視為unicode格式了。下面在Python3環境下進行代碼演示。

1、首先在Windows操作系統下的Python3環境中進行演示,如下圖所示。

可以看到str1就是一個中文的字元串,字元串前面也沒有加u以表示其為unicode編碼,其實也沒有必要加那個字元,因為在Python3中將所有的字元都內置成unicode字元了,這就是Python2和Python3最大的區別。所有在這裡可以直接調用encode()函數對字元串進行編碼,而且也不會報錯。

2、接下來在Linux操作系統下的Python3環境中進行演示,如下圖所示。

這個過程和Windows下是一樣的,這裡就不再贅述了。有個地方需要注意的是在Linux操作系統下,Python3的默認環境編碼變為了utf-8編碼,而不是Python2中的ASCII編碼。

總的來說,Python3解決了一個字元串編碼的重要問題,所以在字元串編碼的報錯方面相對Python2來說要少的多,幫助我們省下了很多事情。小夥伴們,關於在Python2和Python3中字元串的編碼問題這個知識點十分重要,希望大家都可以get到噢~~


推薦閱讀:
相關文章