分类
摘要:
在使用Python做自动化时候遇到登录需要识别验证码问题,此时采用pytesseract模块,遇到异常:
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. ... 阅读原文
2020-12-10 00:49:02 阅读(1972) 评论(0)
摘要:

对于Python的自动化测试或者是爬虫开发... 阅读原文
2020-12-09 23:30:02 阅读(1946) 评论(0)
摘要:
#### 准备
要爬的网站是图虫网工具:python 2.7,BeautifulSoup4
注意:BeautifulSoup4为第三方类库,如果在cmd下用pip安装报错,可直接去官网下载,解压后拷贝到python安装目录中的lib目录下,通过cmd进入插件的目录,输入python setup.py inst... 阅读原文
2020-12-09 22:05:02 阅读(2396) 评论(0)
摘要:

如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人... 阅读原文
2020-12-09 21:03:02 阅读(2251) 评论(0)
摘要:
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
以下文章来源于Python大数据分析 ,作者费弗里
简介
开门见山,今天我们要模仿的数据可视化作品来自 「#TidyTuesday」 活动于2020年1月28日发布的「旧金山街道树木数据集」下的众多参... 阅读原文
2020-12-09 19:19:09 阅读(2005) 评论(0)
摘要:
数据类型(补充) [上一部分]
* 集合* 时间日历
函数
* 函数的参数* 返回值* 偏函数* 高阶函数* 匿名函数* 闭包* 装饰器* 生成器
#### 集合
**无序的**,**不可随机访问的**,**不可重复**的元素集合
* 与数学中的集合类似,可以进行集... 阅读原文
2020-12-09 18:00:06 阅读(2272) 评论(0)
摘要:
[数据类型]* [数值] * [整数] * [浮点数] * [简单数学函数] * [随机函数] * [三角函数]* [布尔类型]* [字符串]* [列表]* [元组]* [字典]
### Python数据类型
#### 数值
#####... 阅读原文
2020-12-09 16:44:01 阅读(2217) 评论(0)
摘要:
[Python注释][Python变量][Python运算符][Python输入输出]
* [输入函数]* [输出函数(3.x)]* [格式化输出]
[分支][循环]
### Python注释
#### 单行注释
```# 这是一个单行注释print("test")
```
#### 多行注释
`... 阅读原文
2020-12-09 15:58:02 阅读(2295) 评论(0)
摘要:
问题引入
前段时间做数据收集时需要下载网宿cdn的日志进行分析。而网宿对日志下载的接口搞得很复杂,又没有提供相应的sdk,只是提供了一个shell脚本,虽然在ubuntu上使用很方便,但是脚本里面的各种重定向分析非常复杂。故此想对重定向在深入了解一点。
查询网宿日志列表的脚本
#!/bin/sh
TMP_F... 阅读原文
2020-12-09 14:03:18 阅读(2197) 评论(0)
摘要:
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
最近发现了一个不错的数据网站,叫“淘数据”。里面的数据都是淘宝的商家数据,包含了店名、类目、标价、成交均价、销量、销售金额等
这个网站还是一位同学和我说才知道的,既然这样,那就开... 阅读原文
2020-12-08 23:09:08 阅读(1984) 评论(0)