Selenium元素定位初探（以今日頭條首頁為例）

隨著網頁技術的發展，動態網頁的比例越來越高，原來抓取靜態網頁的許多方法變得不再適用；再加上越來越多的網站添加了各種複雜的反爬蟲策略，導致直接通過網路請求的方式去抓取頁面的方式已經有些落伍了。

而Selenium可以通過模擬瀏覽器的真實行為來訪問網頁並將頁面源碼緩存下來，從而實現所見即所得的效果。Selenium本身廣泛應用於測試領域，但是它所見即所得的特性基本上滿足了我們抓取絕大多數頁面的需求，因此今天我們就看一下如何通過Selenium訪問頁面並通過不同的方式定位到我們需要的元素，從而完成頁面抓取。