摘要: 一、准备项目   我写的是一个爬取某ppt网站的代码,就一个ppt1.py是爬虫,然后,ppts是存放下载的ppt的   二、准备requirement.txt文件 这个是需要哪些python库支持,写好     三、准备Dockerfile文件 需要一个名为Dockerfile的文件,没有后缀,这个创建... 阅读原文
2019-11-06 08:00:10 阅读(2468) 评论(0)
摘要: 一 读 1. r模式 只读 f = open('t1',mode = 'r',encoding = 'utf-8') f -- 文件句柄 所有对文件的操作都是操作文件句柄 第一个内容是文件的路径,必须是字符串) 第二个内容(mode)是对这个文件的操作方式 可以直接写'r' 第三个内容(encoding)是这... 阅读原文
2019-11-06 07:40:02 阅读(2341) 评论(0)
摘要: 一 深浅拷贝 1. 浅拷贝 lst = [1,2,3,[4,5,6]] lst1 = lst.copy() # lst1 = lst[:] 新开辟一块空间 lst[-1].append(8) print(lst) print(lst1) 输出结果: [1, 2, 3, [4, 5, 6, 8]] [1, ... 阅读原文
2019-11-06 06:00:10 阅读(2439) 评论(0)
摘要: 1 不能使用for循环的形式 列表不能循环添加 变成死循环 li = [1,2,3,4,5] for i in li: li.append(0) #不能这样使用,无线循环 li.append(i) #不能这样使用,无线循环 print(li) #无法输出结果 2 用for循环删除... 阅读原文
2019-11-06 00:54:03 阅读(2608) 评论(0)
摘要: 1 编码 encode a = '你好' s = a.encode('utf-8') #()里为编码集 print(s) #输出的是字节,b代表字节 输出结果:b'\xe4\xbd\xa0\xe5\xa5\xbd' 2 解码 decode a = '你好' s = a.encode('utf-8') ... 阅读原文
2019-11-06 00:00:09 阅读(2279) 评论(0)
摘要:   1.json.dumps()用于将dict类型的数据转成strimport jsondict = {'a': 'wo', 'b': 'zai', 'c': 'zhe', 'd': 'li'}string = json.dumps(dict)print(dict)print(string)print(ty... 阅读原文
2019-11-05 22:23:02 阅读(2349) 评论(0)
摘要: 一、整型 1、用途:一般用于定义整数,如:年龄,身份证号,qq号码等 2、定义方式:age = 18   ---->age = int( 18 ) 3、内置常用方法 (用于数学计算与比较运算) 3.1 进制的转换 3.1.1  其他进制转换10进制 二------->十: (0,1 ) 110  ... 阅读原文
2019-11-05 21:04:02 阅读(2877) 评论(0)
摘要: 目录 一:Splash简介与准备 二:验证码的识别(1)   在之前的博客中,我们学习了selenium的用法,它是一个动态抓取页面的方法,但是,动态抓取页面还有其他的方法,这里介绍Splash方法,并结合具体实例进行讲解。 一:S... 阅读原文
2019-11-05 20:26:04 阅读(2313) 评论(0)
摘要: 并发:多个任务同一时间段进行 并行:多个任务同一时刻进行   线程的实现 线程模块 Python通过两个标准库_thread 和threading,提供对线程的支持 , threading对_thread进行了封装 因此在实际的使用中我们一般都是使用threading threading模块中提供了Threa... 阅读原文
2019-11-05 18:54:08 阅读(2305) 评论(0)
摘要: Celery在Django中的使用介绍 Celery简介 celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必须工具。 它是一个专注于实时处理的任务队列,同时也支持任务调度。 何为任务队列 任务队列:是一种在线程和机器间分发任务的机制。 celery的三大组成部分 wo... 阅读原文
2019-11-05 17:12:04 阅读(2478) 评论(0)