無任何編程基礎,現在在學習Python寫爬蟲,目前可以爬取京東手機價格變動並每次運行完後發郵件發送價格變動的機型。但在抓取蘇寧手機價格的時候遇到了難題,蘇寧的移動版網頁價格也是在js中隱藏的,我現在在還不會抓取。其次是數據存儲問題,目前僅僅把價格存在.txt文件中,一個文件對應一個手機,用各自的ID命名以區分,如果用資料庫的話用什麼比較好?初級目標是抓取各電商手機價格變化和各手機型號銷量。 請各位不吝賜教! 謝謝


蘇寧跟京東思路一樣的, 都是在靜態網頁找到商品的數字編碼,然後用數字編碼通過json鏈接獲取價格. 商品名, 鏈接和評論數也是在靜態網頁找到的.


關於怎麼用post請求獲取蘇寧數據,上面很多大佬已經講得特別詳細了

如果使用post請求獲取數據,需要進行以下幾個步驟:

抓包→獲取請求網址以及參數→發送請求→獲取詳情內容→解析內容→保存數據

基本上每一步都會耗費大量調試時間,如果碰上防採集比較嚴的網站,可能要花個1-2天才能獲取到自己需要的數據。

所以其實如果想要快速獲取數據的話,利益相關,推薦使用我們家的八爪魚。

讓數據採集過程,更加簡單,只需簡單3步,即可獲取到大量數據。

八爪魚內置市面上幾乎所有主流電商網站採集模板,可以很方面的獲取電商相關數據。

另外針對導出,也支持很多種文件格式。

最後,附上八爪魚官網下載鏈接:

免費下載 - 八爪魚採集器?

www.bazhuayu.com

發佈於 2020-02-19繼續瀏覽內容知乎發現更大的世界打開Chrome繼續周緒龍周緒龍12年測試從業經驗,IBM測試開發工程師,蟲師學院創始人

你要看爬取出來的網頁內容,然後分析你需要的數據有什麼特點,再用正則匹配出來,數據爬出來後,保存到mysql資料庫就可以


你要看爬取出來的網頁內容,然後分析你需要的數據有什麼特點,再用正則匹配出來,數據爬出來後,保存到mysql資料庫就可以


數據存儲我用mysql,本地安裝部署稍微有點挑戰,但實效來說,相對於本地文件(無論是txt還是excel,csv),強大太多了!

這是我做的筆記。恰好也是基於爬蟲的目的。

劉娟娟PRESSone:【嘔心總結】python如何與mysql實現交互及常用sql語句?

zhuanlan.zhihu.com圖標
先簡單的說一下,之後會補充。

1. 善用瀏覽器的F12。一切網頁上能看到的東西,都是HTTP請求和基於HTTP請求的腳本、插件執行結果。

2. 請使用MySQL入門。學習期間不推薦其它的資料庫。
推薦閱讀:
相关文章