python爬取网站数据，如何绕过反爬虫策略

2025-01-03 技术教程

1、使用session对象

session=requests.session()strhtml=session.get(url)#与当前网站的首次会话

2、设置headers

headers={"User-Agent":"Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)""Chrome/69.0.3497.100Safari/537.36","Accept":"application/json"}session.headers=headers

3、设置cookies

设置与网站首次会话时的cookies为默认的cookies

cookies=session.cookiessession.headers.setdefault('cookies',cookies)

此后，可以复用之前会话中的cookies了

strhtml2=session.get(url2)

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。

python爬取网站数据，如何绕过反爬虫策略

热门

最新文章

随机文章

TAGS标签

python爬取网站数据，如何绕过反爬虫策略

相关推荐

相关推荐

热门

最新文章

随机文章

TAGS标签