分类
摘要:
一、准备项目
我写的是一个爬取某ppt网站的代码,就一个ppt1.py是爬虫,然后,ppts是存放下载的ppt的
二、准备requirement.txt文件
这个是需要哪些python库支持,写好
三、准备Dockerfile文件
需要一个名为Dockerfile的文件,没有后缀,这个创建... 阅读原文
2019-11-06 08:00:10 阅读(2468) 评论(0)
摘要:
一 读
1. r模式 只读
f = open('t1',mode = 'r',encoding = 'utf-8')
f -- 文件句柄 所有对文件的操作都是操作文件句柄
第一个内容是文件的路径,必须是字符串)
第二个内容(mode)是对这个文件的操作方式 可以直接写'r'
第三个内容(encoding)是这... 阅读原文
2019-11-06 07:40:02 阅读(2341) 评论(0)
摘要:
一 深浅拷贝
1. 浅拷贝
lst = [1,2,3,[4,5,6]]
lst1 = lst.copy() # lst1 = lst[:] 新开辟一块空间
lst[-1].append(8)
print(lst)
print(lst1)
输出结果:
[1, 2, 3, [4, 5, 6, 8]]
[1, ... 阅读原文
2019-11-06 06:00:10 阅读(2439) 评论(0)
摘要:
1 不能使用for循环的形式
列表不能循环添加 变成死循环
li = [1,2,3,4,5]
for i in li:
li.append(0) #不能这样使用,无线循环
li.append(i) #不能这样使用,无线循环
print(li) #无法输出结果
2 用for循环删除... 阅读原文
2019-11-06 00:54:03 阅读(2608) 评论(0)
摘要:
1 编码 encode
a = '你好'
s = a.encode('utf-8') #()里为编码集
print(s) #输出的是字节,b代表字节
输出结果:b'\xe4\xbd\xa0\xe5\xa5\xbd'
2 解码 decode
a = '你好'
s = a.encode('utf-8')
... 阅读原文
2019-11-06 00:00:09 阅读(2279) 评论(0)
摘要:
1.json.dumps()用于将dict类型的数据转成strimport jsondict = {'a': 'wo', 'b': 'zai', 'c': 'zhe', 'd': 'li'}string = json.dumps(dict)print(dict)print(string)print(ty... 阅读原文
2019-11-05 22:23:02 阅读(2349) 评论(0)
摘要:
一、整型
1、用途:一般用于定义整数,如:年龄,身份证号,qq号码等
2、定义方式:age = 18 ---->age = int( 18 )
3、内置常用方法 (用于数学计算与比较运算)
3.1 进制的转换
3.1.1 其他进制转换10进制
二------->十: (0,1 )
110 ... 阅读原文
2019-11-05 21:04:02 阅读(2877) 评论(0)
摘要:
目录
一:Splash简介与准备
二:验证码的识别(1)
在之前的博客中,我们学习了selenium的用法,它是一个动态抓取页面的方法,但是,动态抓取页面还有其他的方法,这里介绍Splash方法,并结合具体实例进行讲解。
一:S... 阅读原文
2019-11-05 20:26:04 阅读(2313) 评论(0)
摘要:
并发:多个任务同一时间段进行
并行:多个任务同一时刻进行
线程的实现
线程模块
Python通过两个标准库_thread 和threading,提供对线程的支持 , threading对_thread进行了封装
因此在实际的使用中我们一般都是使用threading
threading模块中提供了Threa... 阅读原文
2019-11-05 18:54:08 阅读(2305) 评论(0)
摘要:
Celery在Django中的使用介绍
Celery简介
celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必须工具。
它是一个专注于实时处理的任务队列,同时也支持任务调度。
何为任务队列
任务队列:是一种在线程和机器间分发任务的机制。
celery的三大组成部分
wo... 阅读原文
2019-11-05 17:12:04 阅读(2478) 评论(0)