Python問題求教,參數沒有規律,該如何提取每一頁?
請求網址的param參數沒有規律,該如何提取每一頁?
謝謝大家的回答,pn頁碼很規律,不知道cb和最後的_代表啥,雖然只變化頁碼也能爬,但是我害怕拿到的不是當前時間截點的數據。
pn不就是page number嗎
cb是callback,一般對數據沒什麼影響。
不太可能,一定有某處不同;
連續粘貼五頁的網路請求地址,然後對應在paramas裏對比,一定找得到。
pn是page number,pz是page size,cb應該是前面一個常數加上時間戳,ut應該是加密後的參數,其他應該是不變的。
嘗試多找幾個頁面比對比對,然後去看他前端js,看看ut是怎麼生成的。
適當刪掉一些參數試試?有的參數可能並不起作用。
剩餘關鍵參數的含義要憑感覺嘗試和猜測。
沒規律?不累死他們的開發?仔細找
推薦閱讀: