今天咱們來更新一發
講一講另一種形式的反反爬蟲
整個系列:
不吃夾生飯:反反爬蟲系列(一)?zhuanlan.zhihu.com不吃夾生飯:反反爬蟲系列(二)?zhuanlan.zhihu.com不吃夾生飯:反反爬蟲系列(三)?zhuanlan.zhihu.com不吃夾生飯:反反爬蟲系列(四)?zhuanlan.zhihu.com
目標網站:車300 二手車估價
反爬蟲策略: 計算token,放到cookie里,刷新頁面,出現目標頁面
難度:中等偏下
我之前的一篇文章大概講到過如何批量擼這個網站的數據
先吐槽下南京車300,目前我所在的公司的母公司
進入估價頁面,顯示瀏覽器指紋驗證,再是拖滑塊,然後文字點擊
怎麼就沒有銷售出來罵,什麼狗屎用戶體驗
也對,流量都在app上,pc端就是來肝爬蟲的
對於做機器學習要搞OCR文字點擊的,可以去採集訓練集(斜眼笑)
好了,滑動和文字驗證今天咱們不提,就單純講講利用cookie做文章的反爬蟲
進入估價頁面,長醬色的: