需要實現什麼呢
Emmmm,無論是Python爬蟲或者其他語言的爬蟲,從入門到入獄你需要學會這些東西
基礎的語法、Http請求、簡單的資料庫增刪改查、JQuery選擇器、Xpath、Fiddler抓包
然後入門的話需要學習selenium、Cookie
中端的話,該學習JS逆向、OPENCV識別計算、OCR識別
這裡有一個分支,對應移動端:Android逆向拿到源代碼+Hook(Frida 、 Xposed),到這裡學習的東西比較多,可能還要涉及IDA去看so
掌握了這些技能,你就慢慢可以自己摸索出其他可能會遇到的問題了
包括登陸校驗的破解、App移動端的參數破解以及請求方法自己模擬
然後,可以等警察ss上門了
自此、圈子裡流行著你的傳說
@修車的碼農 對主要部分說得很詳細了,補充一下:
牛逼的爬蟲不能只會用Python,而是應該在需要的時候還可以寫一手Android、Golang、Javascript、C之類的其他語言的程序,並且最好能瞭解各種底層的東西(比如網路協議、硬體知識),這樣子即使硬肛走不通也還能有很多別的路子可以選擇。
很多人硬肛肛不過,也想不到其他方法,只能到各種羣裏問,看著都挺難受的。
你這個牛逼 是怎麼定義的
先說好纔有辦法跟你說怎麼辦
據我所知,牛逼的爬蟲都是c++寫出來的。很多人口中的爬蟲其實只是個調包採集網頁而已。你可以試一下快遞查詢這個功能。到快遞各大官網通過單號採集數據。如果能做出來的話,算是瞭解基本的HTTP了。
爬蟲系列在線視頻課程