Python 標準庫之XML

寫在之前

帶分隔符的文件僅有兩維的數據：行 & 列。如果我們想在程序之間交換數據結構，需要一種方法把層次結構，序列，集合和其它的數據結構編碼成文本。

今天要說的 XML 是最突出的處理上述這種轉換的標記格式，它使用標籤（tag）分隔數據。XML 在軟體領域的用途非常廣泛。

XML 是什麼？如果非要對其做一個定義式的說明，那這裡我不得不引用一下 w3school 裡面簡潔而明快的說明：

XML 指可擴展標記語言（EXtensible Markup Language）；
XML 是一種標記語言，類似於 HTML；

XML 的設計宗旨是傳輸數據，而非顯示數據；
XML 標籤沒有被預定義，需要自行定義標籤； XML 被設計為具有自我描述性； XML 是 W3C 的推薦標準。

如果你想要詳細瞭解和學習 XML 的話，可以去閱讀 w3school 的 XML 教程即可，裡面講述的很詳細，在下面我還會引用一些裡面的內容。

XML 的重要性在於它是用來傳輸數據的，因此，特別是在 Web 編程中我們經常會用到它。有了它，讓數據傳輸變的更加簡單，這麼重要的東西，我大 Python 當然支持。

有大佬曾經說過：「一個引人關注的東西總會有很多人從不同側面去研究它」。這個在編程中也同樣適用，所以對於 XML 這個紅得發紫的東西，Python 提供了多種模塊來處理。

xml.dom.* 模塊：Document Object Model。適合用於處理 DOM API。它能夠將 XML 數據在內存中解析成一個樹，然後通過對樹的操作來操作 XML。但是這種方式由於將 XML 數據映射到內存中的樹，導致比較慢，且消耗更多內存。
xml.sax.* 模塊：simple API for XML。由於 SAX 以流式讀取 XML 文件，從而速度較快，佔用內存少，但是在操作上稍微複雜，需要用戶實現回調函數。

當然還有一些別的，比如 xml.parse.expat，xml.etree.ElementTree 等等，我就不在列舉了，碰到的時候再去查查，否則光看這些東西頭就大了，而且無聊的很。