Python爬蟲教程-21-xpath簡介
什麼是 XPath?
- XPath 使用路徑表達式在 XML 文檔中進行導航
- XPath 包含一個標準函數庫
- XPath 是 XSLT 中的主要元素
- XPath 是一個 W3C 標準
用途:它是一種用來確定XML文檔中某部分位置的語言
XPath開發工具:
- 開源的XPath表達式工具:XMLQuire
- Chrome 插件:XPath Helper
- FIrefox插件:XPath CHecker
XPath基於XML的樹狀結構,提供在數據結構樹中找尋節點的能力。起初XPath的提出的初衷是將其作為一個通用的、介於XPointer與XSL間的語法模型。但是XPath很快的被開發者採用來當作小型查詢語言
在 XPath 中,有七種類型的節點:元素、屬性、文本、命名空間、處理指令、注釋以及文檔節點(或稱為根節點
原文:
Python爬蟲教程-21-xpath簡介 - 肖朋偉 - CSDN博客xml案例py24
<?xml version="1.0" encoding="UTF-8" ?>
<booksore>
<book category="cooking">
<title lang="en">Everyday Italian</title>
<auther>Gidada De</auther>
<year>2018</year>
<price>23</price>
</book>
<book category="education">
<title lang="en">Python is Python</title>
<auther>Food War</auther>
<year>2008</year>
<price>83</price>
</book>
<book category="sport">
<title lang="en">Running</title>
<auther>Klaus Kuka</auther>
<year>2010</year>
<price>43</price>
</book>
</booksore>
XPath 路徑表達式
- XPath 使用路徑表達式來選取 XML 文檔中的節點或者節點集。這些路徑表達式和我們在常規的電腦文件系統中看到的表達式非常相似。
- 常用路徑表達式: