分类
摘要:
简介
Scrapy一个开源和协作的框架,其最初是为了页面抓取所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测试等领域,也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) ... 阅读原文
2019-07-07 18:57:03 阅读(2526) 评论(0)
摘要:
前言
前几天有个朋友托我帮忙爬一个网站,第一次打开那个网站时,我去,它竟然就要验证码,不过当时是想加几个header应该就能解决,不过事实证明我还是错了。接下来将记录下爬虫中遇到的一些坑以及解决办法。
开始
相关
目标网站:AVADA – Avada Commerce
使用了Cloudflare的cdn服务,而且... 阅读原文
2019-07-07 17:18:02 阅读(2375) 评论(0)
摘要:
深浅拷贝
在python中,对象赋值实际上是对象的引用。当创建一个对象,然后把它赋给另一个变量的时候,python并没有拷贝这个对象,而只是拷贝了这个对象的引用
浅拷贝:只拷贝第一层元素
li = [1,2,3,4,[5,6,7]]
lst = li.copy() #创建新的内存 浅拷贝只拷贝一层
prin... 阅读原文
2019-07-07 16:25:02 阅读(2322) 评论(0)
摘要:
一、百分号方式
%[(name)][flags][width].[precision]typecode
(name) 可选,用于选择指定的key
flags 可选,可供选择的值有:
+ 右对齐;正数前加正好,负数前加负号;
- 左对齐;正数前... 阅读原文
2019-07-07 14:27:01 阅读(2408) 评论(0)
摘要:
python递归实现"abcd"字符串全排列
1.保持a不动,动bcd
2.保持b不动,动cd
3.保持c不动,动d
def pailie(head="",string=""):
if len(string)>1:
for father_string in string:
... 阅读原文
2019-07-07 12:51:01 阅读(2530) 评论(0)
摘要:
python 编码转换
了解字符编码的知识储备
文本编辑器存取文件的原理(nodepad++,pycharm,word)
打开编辑器就打开了启动了一个进程,是在内存中的,所以在编辑器编写的内容也都是存放与内存中的,断电后数据丢失,因而需要保存到硬盘上,点击保存按钮,就从内存中把数据刷到了硬盘上。在这一点上,... 阅读原文
2019-07-07 11:22:03 阅读(2324) 评论(0)
摘要:
REFERENCE:《Head First Python》
ID:我的第一篇[Python学习]
BIRTHDAY:2019.7.6
EXPERIENCE_SHARING:两个程序错误类型
1、错误类型:
>>> for each_item in movies:
i... 阅读原文
2019-07-07 11:13:02 阅读(2381) 评论(0)
摘要:
一.计算机基础
输入输出设备:cpu 硬盘 内存
中央处理器
内存:存储数据
硬盘:存储数据
什么是操作系统
控制计算机工作流程的软件
应用程序:安装在操作系统之上的软件
二.python简介
Python历史
Python 2.0 - October 16, 2000,加入了内存回收机制,构成了现在Pyt... 阅读原文
2019-07-07 10:35:01 阅读(3659) 评论(0)
摘要:
一、类变量
在类命名空间内定义的变量就属于类变量,python允许使用类来修改、读取类变量。
例:
class a:
b = '我是类变量'
def c(self):
print (a.b) # 通过类访问类变量b
print (a.b) # 通过类访问类变量,打印 我是类变量
... 阅读原文
2019-07-07 08:35:02 阅读(3659) 评论(0)
摘要:
编程语言总体分以为机器语言、汇编语言、高级语言:机器语言:计算机硬件能够直接使用的编程语言,二进制的集合,属于低级语言。汇编语言:借助符号代替机器指令,与机器指令对应,面向计算机硬件的,容易理解和记忆,属于低级语言。高级语言:与计算机硬件无关,其表达方式接近于所描述的问题,更易于掌握。
高级语言所编制的程序不能直接被... 阅读原文
2019-07-07 06:35:04 阅读(2413) 评论(0)