基于http请求与响应实现的网页源码读取的相关操作技巧
这篇文章主要介绍了python实现的下载网页源码功能,涉及python基于http请求与响应实现的网页源码读取功能相关操作技巧,需要的朋友可以参考下
本文实例讲述了Python实现的下载网页源码功能。分享给大家供大家参考,具体如下:
#!/usr/bin/pythonimport httplibhttpconn = httplib.HTTPConnection("www.baidu.com")httpconn.request("GET", "/index.html")resp = httpconn.getresponse()if resp.reason == "OK": resp_data = resp.read() print resp_data print len(resp_data)httpconn.close()
要下载的网页源码被读取到了resp_data中了
运行效果图如下:
文章推荐
-
分享Python实现dns查询功能实例
这篇文章主要介绍了python实现的简单dns查询功能,结合实例形式分析了python基于socket模块的dns信息查...
Python
34秒前 0 -
python爬虫入门(3)--利用requests构建知乎API
这篇文章主要给大家介绍了关于python爬虫入门之利用requests构建知乎api的相关资料,文中通过示例代码介绍的非...
Python
1分钟前 0 -
python爬虫入门(4)--详解HTML文本的解析库BeautifulSoup
beautiful soup是python的一个库,最主要的功能是从网页抓取数据。下面这篇文章主要给大家介绍了pytho...
Python
2分钟前 0 -
python爬虫入门(1)--快速理解HTTP协议
http协议是互联网里面最重要,最基础的协议之一,我们的爬虫需要经常和http协议打交道。下面这篇文章主要给大家介绍了关...
Python
2分钟前 0 -
分享一个利用Python爬虫模拟知乎登录的实例
在爬虫过程中,有些页面在登录之前是被禁止抓取的,这个时候就需要模拟登陆了,下面这篇文章主要给大家介绍了利用python爬...
Python
4分钟前 0
最新文章
- 分享Python实现dns查询功能实例 34秒前
- python爬虫入门(3)--利用requests构建知乎API 1分钟前
- python爬虫入门(4)--详解HTML文本的解析库BeautifulSoup 2分钟前
- python爬虫入门(1)--快速理解HTTP协议 2分钟前
- 分享一个利用Python爬虫模拟知乎登录的实例 4分钟前
- Python命名空间与作用域 4分钟前
- Windows平台python2和3的兼容问题 5分钟前
- python函数参数的不同 6分钟前
- 正则表达式(regular) 6分钟前
- 将爬取数据存入mysql 7分钟前