摘要: 前言 闲来无事就要练练代码,不知道最近爬取什么网站好,就拿纵横网爬取我最喜欢的雪中悍刀行练手吧 准备 python3 scrapy 项目创建: cmd命令行切换到工作目录创建scrapy项目  两条命令 scarpy startproject与scrapy genspider    然后用py... 阅读原文
2019-09-19 11:02:09 阅读(2340) 评论(0)
摘要: 一、迭代器 迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。 1.1 判断一个对象是否可迭代 可以使用 isinstance() 判断一个对象是否是 Iterable 对象: In [... 阅读原文
2019-09-19 09:46:09 阅读(2429) 评论(0)
摘要: Python分布式爬虫必学框架Scrapy打造搜索引擎 部分课程截图:  点击链接或搜索QQ号直接加群获取其它资料:   链接:https://pan.baidu.com/s/1-wHr4dTAxfd51Mj9DxiJ4Q 提取码:ik1n 免费分享,如若链接失效请加群 其它资源在群里,私... 阅读原文
2019-09-19 08:30:09 阅读(2424) 评论(0)
摘要: 前几天看到一个关于Python的面试题 lst = [1, 2, [3]] lst1 = lst * 2  #  [1, 2, [3], 1, 2, [3]] lst1[2].append(4)  # [3, 4] print(lst1) 开始时,就处理错了。最终上机测试发现,乘法貌似是内存地址的拷... 阅读原文
2019-09-19 07:09:05 阅读(2684) 评论(0)
摘要: 到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是: 第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。 第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。 第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信... 阅读原文
2019-09-19 06:02:04 阅读(3580) 评论(0)
摘要: 到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是: 第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。 第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。 第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信... 阅读原文
2019-09-19 06:01:28 阅读(2417) 评论(0)
摘要: 什么是运算符? 本章节主要说明Python的运算符。举个简单的例子 4 +5 = 9 。 例子中,4 和 5 被称为操作数,"+" 称为运算符。 Python语言支持以下类型的运算符: 算术运算符 比较(关系)运算符 赋值运算符 逻辑运算符 位运算符 ... 阅读原文
2019-09-18 22:13:05 阅读(2457) 评论(0)
摘要: #-----三次登录实验----- 1 memu = { 2 "陕西":{ 3 "西安市":{ 4 "新城区":["大明宫遗址","含元殿遗址","八路军办事处"], 5 "碑林区":["安碑林博物馆","明城墙... 阅读原文
2019-09-18 21:15:02 阅读(2580) 评论(0)
摘要: Python 入门之 内置模块 -- re模块 1、re 模块 (1)什么是正则?  正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列... 阅读原文
2019-09-18 19:28:02 阅读(2346) 评论(0)
摘要:  如下设置: 1、settings 2、file and code templates 3、点击图中绿色的“+”号,即可打开新建模板页面 4、定义模板名字、后缀名保存即可 阅读原文
2019-09-18 19:08:02 阅读(2354) 评论(0)