分类
摘要:
前言
闲来无事就要练练代码,不知道最近爬取什么网站好,就拿纵横网爬取我最喜欢的雪中悍刀行练手吧
准备
python3
scrapy
项目创建:
cmd命令行切换到工作目录创建scrapy项目 两条命令 scarpy startproject与scrapy genspider 然后用py... 阅读原文
2019-09-19 11:02:09 阅读(2340) 评论(0)
摘要:
一、迭代器
迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
1.1 判断一个对象是否可迭代
可以使用 isinstance() 判断一个对象是否是 Iterable 对象:
In [... 阅读原文
2019-09-19 09:46:09 阅读(2429) 评论(0)
摘要:
Python分布式爬虫必学框架Scrapy打造搜索引擎
部分课程截图:
点击链接或搜索QQ号直接加群获取其它资料:
链接:https://pan.baidu.com/s/1-wHr4dTAxfd51Mj9DxiJ4Q 提取码:ik1n
免费分享,如若链接失效请加群
其它资源在群里,私... 阅读原文
2019-09-19 08:30:09 阅读(2424) 评论(0)
摘要:
前几天看到一个关于Python的面试题
lst = [1, 2, [3]]
lst1 = lst * 2 # [1, 2, [3], 1, 2, [3]]
lst1[2].append(4) # [3, 4]
print(lst1)
开始时,就处理错了。最终上机测试发现,乘法貌似是内存地址的拷... 阅读原文
2019-09-19 07:09:05 阅读(2684) 评论(0)
摘要:
到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是:
第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。
第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。
第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信... 阅读原文
2019-09-19 06:02:04 阅读(3580) 评论(0)
摘要:
到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是:
第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。
第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。
第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信... 阅读原文
2019-09-19 06:01:28 阅读(2417) 评论(0)
摘要:
什么是运算符?
本章节主要说明Python的运算符。举个简单的例子 4 +5 = 9 。 例子中,4 和 5 被称为操作数,"+" 称为运算符。
Python语言支持以下类型的运算符:
算术运算符
比较(关系)运算符
赋值运算符
逻辑运算符
位运算符
... 阅读原文
2019-09-18 22:13:05 阅读(2457) 评论(0)
摘要:
#-----三次登录实验-----
1 memu = {
2 "陕西":{
3 "西安市":{
4 "新城区":["大明宫遗址","含元殿遗址","八路军办事处"],
5 "碑林区":["安碑林博物馆","明城墙... 阅读原文
2019-09-18 21:15:02 阅读(2580) 评论(0)
摘要:
Python 入门之 内置模块 -- re模块
1、re 模块
(1)什么是正则?
正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列... 阅读原文
2019-09-18 19:28:02 阅读(2346) 评论(0)
摘要:
如下设置:
1、settings
2、file and code templates
3、点击图中绿色的“+”号,即可打开新建模板页面
4、定义模板名字、后缀名保存即可
阅读原文
2019-09-18 19:08:02 阅读(2354) 评论(0)