分类
摘要:
我们之前一直都在使用的urlopen,这是一个特殊的opener(也就是模块帮我们构建好的)。
但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级功能。所以要支持这些功能:
1.使用相差的Handler处理器来创建特定功能的处理器对象;
2.然后通过urllib.requ... 阅读原文
2017-07-18 22:52:01 阅读(807) 评论(0)
摘要:
python 第二例,爬取百度贴吧的帖子,获取帖子的标题,内容,所在楼层,发布时间
其中存在一个问题,当该帖子是手机端发布的帖子,此时在页面中会有标识,因此多一个span标签,与楼层和发布时间的标签一样
解决方法: 目潜想到的解决方法是通过判断爬到的值来进行选择,但解决方案效率肯定低,因此未使用,等知识体系丰富后再进... 阅读原文
2017-07-18 20:57:02 阅读(817) 评论(0)
摘要:
1.__doc__ 表示类的描述信息
class Food(object):
"定义一个食物类"
pass
print(Food.__doc__)
#输出
定义一个食物类
2.__module__ 和 __class__
__module__ 表示当前操作对象在哪个模块
__cla... 阅读原文
2017-07-18 19:02:06 阅读(821) 评论(0)
摘要:
1,try…except
(1) 关注是否会引起异常的语句放在try段;
(2) 根据异常的不同,except可以有多个分支;
(3) 可以有一个else分支,表示没有异常发生。
例如:
2,raise
(1) 假如在try部分有条件分支,而分... 阅读原文
2017-07-18 17:41:06 阅读(780) 评论(0)
摘要:
urllib.parse.urlencode()和urllib.parse.unquote()
编码工作使用urllib.parse的urlencode()函数,帮我们将key:value这样的键值对转换成"key=value"这样的字符串,解码工作可以使用urllib的unquote()函数。
# pytho... 阅读原文
2017-07-18 16:31:05 阅读(881) 评论(0)
摘要:
功能: 1、使用SELECT或SELECTORS模块实现并发简单版FTP 2、允许多用户并发上传下载文件环境: python 3.5特性: select 实现并发效果运行: get 文件名 #从服务器下载文件 put 文件名 ... 阅读原文
2017-07-18 16:13:03 阅读(803) 评论(0)
摘要:
print('Hello,world!')
name = 'cc'
name2 = name
name = 'cuichen'
print(name,name2)
name2 = name 只是通过name指向‘cc’,name2并不指向name,所以即使name指向改变,name2并不改变理解变量在计算机内存中... 阅读原文
2017-07-18 14:50:01 阅读(785) 评论(0)
摘要:
1 什么是函数?
2 为什么要用函数?
3 函数的分类:内置函数与自定义函数
4 如何自定义函数
语法
定义有参数函数,及有参函数的应用场景
定义无参数函数,及无参函数的应用场景
定义空函数,及空函数的应用场景
5 调用函数
如何调用函数
函数的返回值
... 阅读原文
2017-07-18 12:18:04 阅读(827) 评论(0)
摘要:
今天总结一下数据类型中的数字和字符串型。
预习:
# 写代码,有如下变量,请按照要求实现每个功能 (共6分,每小题各0.5分)
name = " aleX"
# 1) 移除 name 变量对应的值两边的空格,并输出处理结果
# 2) 判断 name 变量对应的值是否以 "al" 开头,并输出结果
#... 阅读原文
2017-07-18 08:49:02 阅读(821) 评论(0)
摘要:
Python数据网络采集5--处理Javascript和重定向
到目前为止,我们和网站服务器通信的唯一方式,就是发出HTTP请求获取页面。有些网页,我们不需要单独请求,就可以和网络服务器交互(收发信息),那么这个网页可能采用了Ajax技术来加载数据。使用以前的采集方法,可能只能采集到加载之前的数据,重要的数据就抓不到... 阅读原文
2017-07-18 08:26:02 阅读(832) 评论(0)