摘要: APP抓包 前面我们了解了一些关于 Python 爬虫的知识,不过都是基于 PC 端浏览器网页中的内容进行爬取。现在手机 App 用的越来越多,而且很多也没有网页端,比如抖音就没有网页版,那么上面的视频就没法批量抓取了吗? 答案当然是 No!对于 App 来说应用内的通信过程和网页是类似的,都是向后台发送请求,获取数... 阅读原文
2019-01-22 20:22:47 阅读(2881) 评论(0)
摘要:   关于博客访问量的问题,影响因素有很多,例如你的权重,你的博客数量,包括你的标题是否吸引人都是一个衡量的标准。 这些东西需要的是日积月累,今天我们从其中的一个维度入手:发帖时间。相信大家都明白,不论是csdn,博客园这种技术博客 还是今日头条百度贴吧或者抖音快手这种娱乐论坛,都有自己的在线高峰期。例如百度贴吧,用户... 阅读原文
2019-01-22 19:29:42 阅读(2457) 评论(0)
摘要:   关于博客访问量的问题,影响因素有很多,例如你的权重,你的博客数量,包括你的标题是否吸引人都是一个衡量的标准。 这些东西需要的是日积月累,今天我们从其中的一个维度入手:发帖时间。相信大家都明白,不论是csdn,博客园这种技术博客 还是今日头条百度贴吧或者抖音快手这种娱乐论坛,都有自己的在线高峰期。例如百度贴吧,用户... 阅读原文
2019-01-22 19:29:40 阅读(2428) 评论(0)
摘要: 1. 虎嗅网文章数据----写在前面 今天继续使用pyspider爬取数据,很不幸,虎嗅资讯网被我选中了,网址为 https://www.huxiu.com/ 爬的就是它的资讯频道,本文章仅供学习交流使用,切勿用作其他用途。 常规操作,分析待爬取的页面 拖拽页面到最底部,会发现一个加载更多按钮,点击之后,抓取一下请求... 阅读原文
2019-01-22 18:56:04 阅读(2516) 评论(0)
摘要: 一、装饰器 1、什么是装饰器? 器=》工具,装饰=》增加功能 1、不修改源代码 2、不修改调用方式 装饰器是在遵循1和2原则的基础上为被装饰对象增加功能的工具 2、实现无参装饰器 1、无参装饰器的模板 def outter(func): def ... 阅读原文
2019-01-22 17:06:02 阅读(3178) 评论(0)
摘要: 1.1 变量的命名和使用规范   变量名可以包含数字、字母、下划线,但是不能以数字开头。   变量名不能包含空格,可使用下划线来分割其中的单词。   不要将Python关键字和函数名用作变量名。   变量名应既简短又具有描述性。    慎用小写字母l和o,因为他们可能被错看成数字1和0   尽量使用小写的python... 阅读原文
2019-01-22 15:11:02 阅读(2472) 评论(0)
摘要: 1、ROI 操作 src = cv.imread('./1.jpg') cv.imshow('src',src) dst = src[40:240,100:300] gray = cv.cvtColor(dst, cv.COLOR_BGR2GRAY) im = cv.cvtColor(gray,cv.COLOR_G... 阅读原文
2019-01-22 14:20:12 阅读(2452) 评论(0)
摘要:    如果你写了一个python库,想让别人快速使用你的库,最简单的方式就是使用python官方出品的库托管网站pypi了。    pypi的全称是Python Package Index,是python的一个软件仓库。pypi可以帮助你找到和安装由社区开发和共享的python库。包的作者可以使用pypi来分发和共享... 阅读原文
2019-01-22 12:32:09 阅读(2557) 评论(0)
摘要: '''文件名:小双双文件内容如下: 昨夜寒蝉不住鸣。惊回千里梦,已三更。起来独自绕阶行。人悄悄,帘外月胧明。白首为功名,旧山松饰老,阻归程。欲将心事付瑶琴。知音少,弦断有谁听。''' 1. 1 f = open('小双双', 'r') 2 print(f.readline().strip()) # 读取文件第一行... 阅读原文
2019-01-22 11:58:44 阅读(2750) 评论(0)
摘要: <?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008<... 阅读原文
2019-01-22 09:11:01 阅读(2561) 评论(0)