【Python学习笔记】爬虫基础(urllib获取网页信息)

所用版本:Python 3.6

利用urllib.request.urlopen()获取指定网页的源代码,并存入一个对象中。用这个对象的read()和decode()方法进行读取和解码。urllib.request.urlopen()默认获取一个get请求的响应,如果使用data参数,则为post请求。为了应对某些网站的反爬机制,需要程序伪装成真实用户,封装一个请求对象。

Subscribe
提醒
guest
0 评论
Inline Feedbacks
View all comments