摘要: 我们之前一直都在使用的urlopen,这是一个特殊的opener(也就是模块帮我们构建好的)。 但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级功能。所以要支持这些功能:   1.使用相差的Handler处理器来创建特定功能的处理器对象;   2.然后通过urllib.requ... 阅读原文
2017-07-18 22:52:01 阅读(807) 评论(0)
摘要: python 第二例,爬取百度贴吧的帖子,获取帖子的标题,内容,所在楼层,发布时间 其中存在一个问题,当该帖子是手机端发布的帖子,此时在页面中会有标识,因此多一个span标签,与楼层和发布时间的标签一样 解决方法: 目潜想到的解决方法是通过判断爬到的值来进行选择,但解决方案效率肯定低,因此未使用,等知识体系丰富后再进... 阅读原文
2017-07-18 20:57:02 阅读(817) 评论(0)
摘要: 1.__doc__ 表示类的描述信息 class Food(object): "定义一个食物类" pass print(Food.__doc__) #输出 定义一个食物类    2.__module__ 和 __class__ __module__ 表示当前操作对象在哪个模块 __cla... 阅读原文
2017-07-18 19:02:06 阅读(821) 评论(0)
摘要: 1,try…except       (1) 关注是否会引起异常的语句放在try段;       (2) 根据异常的不同,except可以有多个分支;       (3) 可以有一个else分支,表示没有异常发生。       例如:       2,raise       (1) 假如在try部分有条件分支,而分... 阅读原文
2017-07-18 17:41:06 阅读(780) 评论(0)
摘要: urllib.parse.urlencode()和urllib.parse.unquote() 编码工作使用urllib.parse的urlencode()函数,帮我们将key:value这样的键值对转换成"key=value"这样的字符串,解码工作可以使用urllib的unquote()函数。 # pytho... 阅读原文
2017-07-18 16:31:05 阅读(881) 评论(0)
摘要: 功能: 1、使用SELECT或SELECTORS模块实现并发简单版FTP 2、允许多用户并发上传下载文件环境:  python 3.5特性:  select 实现并发效果运行: get 文件名 #从服务器下载文件 put 文件名 ... 阅读原文
2017-07-18 16:13:03 阅读(803) 评论(0)
摘要: print('Hello,world!') name = 'cc' name2 = name name = 'cuichen' print(name,name2) name2 = name 只是通过name指向‘cc’,name2并不指向name,所以即使name指向改变,name2并不改变理解变量在计算机内存中... 阅读原文
2017-07-18 14:50:01 阅读(785) 评论(0)
摘要: 1 什么是函数? 2 为什么要用函数? 3 函数的分类:内置函数与自定义函数 4 如何自定义函数 语法 定义有参数函数,及有参函数的应用场景 定义无参数函数,及无参函数的应用场景 定义空函数,及空函数的应用场景 5 调用函数 如何调用函数 函数的返回值 ... 阅读原文
2017-07-18 12:18:04 阅读(827) 评论(0)
摘要: 今天总结一下数据类型中的数字和字符串型。 预习: # 写代码,有如下变量,请按照要求实现每个功能 (共6分,每小题各0.5分) name = " aleX" # 1) 移除 name 变量对应的值两边的空格,并输出处理结果 # 2) 判断 name 变量对应的值是否以 "al" 开头,并输出结果
 #... 阅读原文
2017-07-18 08:49:02 阅读(821) 评论(0)
摘要: Python数据网络采集5--处理Javascript和重定向 到目前为止,我们和网站服务器通信的唯一方式,就是发出HTTP请求获取页面。有些网页,我们不需要单独请求,就可以和网络服务器交互(收发信息),那么这个网页可能采用了Ajax技术来加载数据。使用以前的采集方法,可能只能采集到加载之前的数据,重要的数据就抓不到... 阅读原文
2017-07-18 08:26:02 阅读(832) 评论(0)