分类
摘要:
APP抓包
前面我们了解了一些关于 Python 爬虫的知识,不过都是基于 PC 端浏览器网页中的内容进行爬取。现在手机 App 用的越来越多,而且很多也没有网页端,比如抖音就没有网页版,那么上面的视频就没法批量抓取了吗?
答案当然是 No!对于 App 来说应用内的通信过程和网页是类似的,都是向后台发送请求,获取数... 阅读原文
2019-01-22 20:22:47 阅读(2881) 评论(0)
摘要:
关于博客访问量的问题,影响因素有很多,例如你的权重,你的博客数量,包括你的标题是否吸引人都是一个衡量的标准。
这些东西需要的是日积月累,今天我们从其中的一个维度入手:发帖时间。相信大家都明白,不论是csdn,博客园这种技术博客
还是今日头条百度贴吧或者抖音快手这种娱乐论坛,都有自己的在线高峰期。例如百度贴吧,用户... 阅读原文
2019-01-22 19:29:42 阅读(2457) 评论(0)
摘要:
关于博客访问量的问题,影响因素有很多,例如你的权重,你的博客数量,包括你的标题是否吸引人都是一个衡量的标准。
这些东西需要的是日积月累,今天我们从其中的一个维度入手:发帖时间。相信大家都明白,不论是csdn,博客园这种技术博客
还是今日头条百度贴吧或者抖音快手这种娱乐论坛,都有自己的在线高峰期。例如百度贴吧,用户... 阅读原文
2019-01-22 19:29:40 阅读(2428) 评论(0)
摘要:
1. 虎嗅网文章数据----写在前面
今天继续使用pyspider爬取数据,很不幸,虎嗅资讯网被我选中了,网址为 https://www.huxiu.com/ 爬的就是它的资讯频道,本文章仅供学习交流使用,切勿用作其他用途。
常规操作,分析待爬取的页面
拖拽页面到最底部,会发现一个加载更多按钮,点击之后,抓取一下请求... 阅读原文
2019-01-22 18:56:04 阅读(2516) 评论(0)
摘要:
一、装饰器
1、什么是装饰器?
器=》工具,装饰=》增加功能
1、不修改源代码
2、不修改调用方式
装饰器是在遵循1和2原则的基础上为被装饰对象增加功能的工具
2、实现无参装饰器
1、无参装饰器的模板
def outter(func):
def ... 阅读原文
2019-01-22 17:06:02 阅读(3178) 评论(0)
摘要:
1.1 变量的命名和使用规范
变量名可以包含数字、字母、下划线,但是不能以数字开头。
变量名不能包含空格,可使用下划线来分割其中的单词。
不要将Python关键字和函数名用作变量名。
变量名应既简短又具有描述性。
慎用小写字母l和o,因为他们可能被错看成数字1和0
尽量使用小写的python... 阅读原文
2019-01-22 15:11:02 阅读(2472) 评论(0)
摘要:
1、ROI 操作
src = cv.imread('./1.jpg')
cv.imshow('src',src)
dst = src[40:240,100:300]
gray = cv.cvtColor(dst, cv.COLOR_BGR2GRAY)
im = cv.cvtColor(gray,cv.COLOR_G... 阅读原文
2019-01-22 14:20:12 阅读(2452) 评论(0)
摘要:
如果你写了一个python库,想让别人快速使用你的库,最简单的方式就是使用python官方出品的库托管网站pypi了。
pypi的全称是Python Package Index,是python的一个软件仓库。pypi可以帮助你找到和安装由社区开发和共享的python库。包的作者可以使用pypi来分发和共享... 阅读原文
2019-01-22 12:32:09 阅读(2557) 评论(0)
摘要:
'''文件名:小双双文件内容如下:
昨夜寒蝉不住鸣。惊回千里梦,已三更。起来独自绕阶行。人悄悄,帘外月胧明。白首为功名,旧山松饰老,阻归程。欲将心事付瑶琴。知音少,弦断有谁听。'''
1.
1 f = open('小双双', 'r')
2 print(f.readline().strip()) # 读取文件第一行... 阅读原文
2019-01-22 11:58:44 阅读(2750) 评论(0)
摘要:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008<... 阅读原文
2019-01-22 09:11:01 阅读(2561) 评论(0)