摘要: 在使用Python做自动化时候遇到登录需要识别验证码问题,此时采用pytesseract模块,遇到异常: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. ... 阅读原文
2020-12-10 00:49:02 阅读(1972) 评论(0)
摘要: ![image](https://upload-images.jianshu.io/upload_images/25205170-1bcd2a456ae595db?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 对于Python的自动化测试或者是爬虫开发... 阅读原文
2020-12-09 23:30:02 阅读(1946) 评论(0)
摘要: #### 准备 要爬的网站是图虫网工具:python 2.7,BeautifulSoup4 注意:BeautifulSoup4为第三方类库,如果在cmd下用pip安装报错,可直接去官网下载,解压后拷贝到python安装目录中的lib目录下,通过cmd进入插件的目录,输入python setup.py inst... 阅读原文
2020-12-09 22:05:02 阅读(2396) 评论(0)
摘要: ![图片](https://upload-images.jianshu.io/upload_images/25205170-23a545bdf41ac694?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人... 阅读原文
2020-12-09 21:03:02 阅读(2251) 评论(0)
摘要: 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 以下文章来源于Python大数据分析 ,作者费弗里   简介 开门见山,今天我们要模仿的数据可视化作品来自 「#TidyTuesday」 活动于2020年1月28日发布的「旧金山街道树木数据集」下的众多参... 阅读原文
2020-12-09 19:19:09 阅读(2005) 评论(0)
摘要: 数据类型(补充) [上一部分] * 集合* 时间日历 函数 * 函数的参数* 返回值* 偏函数* 高阶函数* 匿名函数* 闭包* 装饰器* 生成器 #### 集合 **无序的**,**不可随机访问的**,**不可重复**的元素集合 * 与数学中的集合类似,可以进行集... 阅读原文
2020-12-09 18:00:06 阅读(2272) 评论(0)
摘要: [数据类型]* [数值] * [整数] * [浮点数] * [简单数学函数] * [随机函数] * [三角函数]* [布尔类型]* [字符串]* [列表]* [元组]* [字典] ### Python数据类型 #### 数值 #####... 阅读原文
2020-12-09 16:44:01 阅读(2217) 评论(0)
摘要: [Python注释][Python变量][Python运算符][Python输入输出] * [输入函数]* [输出函数(3.x)]* [格式化输出] [分支][循环] ### Python注释 #### 单行注释 ```# 这是一个单行注释print("test") ``` #### 多行注释 `... 阅读原文
2020-12-09 15:58:02 阅读(2295) 评论(0)
摘要: 问题引入 前段时间做数据收集时需要下载网宿cdn的日志进行分析。而网宿对日志下载的接口搞得很复杂,又没有提供相应的sdk,只是提供了一个shell脚本,虽然在ubuntu上使用很方便,但是脚本里面的各种重定向分析非常复杂。故此想对重定向在深入了解一点。 查询网宿日志列表的脚本 #!/bin/sh TMP_F... 阅读原文
2020-12-09 14:03:18 阅读(2197) 评论(0)
摘要: 前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。       最近发现了一个不错的数据网站,叫“淘数据”。里面的数据都是淘宝的商家数据,包含了店名、类目、标价、成交均价、销量、销售金额等   这个网站还是一位同学和我说才知道的,既然这样,那就开... 阅读原文
2020-12-08 23:09:08 阅读(1984) 评论(0)