PHP前端开发

python爬虫怎么设置请求头

百变鹏仔 1个月前 (01-23) #Python
文章标签 爬虫

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

 

headers

谷歌或者火狐浏览器,在网页面上点击:右键–检查;点击更多工具-开发者工具;直接F12亦可。然后再按Fn+F5刷新出网页来显示元素

有的浏览器是点击:右键->查看元素,刷新

立即学习“Python免费学习笔记(深入)”;