python cookie反爬處理的實現
Cookies的處理
作用保存客戶端的相關狀態
在爬蟲中如果遇到了cookie的反爬如何處理?
手動處理 在抓包工具中捕獲cookie,將其封裝在headers中 應用場景:cookie沒有有效時長且不是動態變化
自動處理 使用session機制 使用場景:動態變化的cookie session對象:該對象和requests模塊用法幾乎一致.如果在請求的過程中產生了cookie,如果該請求使用session發起的,則cookie會被自動存儲到session中.
案例
爬取雪球網中的新聞資訊數據:https://xueqiu.com/
#獲取一個session對象import requestsheaders = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36’}session = requests.Session()main_url = ’https://xueqiu.com’ #推測對該url發起請求會產生cookiesession.get(main_url,headers=headers)url = ’https://xueqiu.com/v4/statuses/public_timeline_by_category.json’params = { ’since_id’: ’-1’, ’max_id’: ’20346152’, ’count’: ’15’, ’category’: ’-1’,}page_text = session.get(url,headers=headers,params=params).json()page_text
到此這篇關于python cookie反爬處理的實現的文章就介紹到這了,更多相關python cookie反爬內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!
相關文章: