摘要: 百度百科上关于正则表达式的解释:   例:判断是否是手机号码 未采用正则表达式     re模块介绍 常用函数 re.match()函数:扫描整个字符串,返回从起始位置成功的匹配 语法:re.match(pattern, string, flags=0) pattern 匹配的正则表达式;string ... 阅读原文
2018-07-05 22:59:06 阅读(1602) 评论(0)
摘要: 常见的反爬策略 首先,既然要破解这些常见的反爬策略,就首先需要知道常见的反爬策略有哪些,所谓知己知彼,百战百胜。   解决策略 1. 伪装user agent User-Agent是检查用户所用客户端的种类和版本。通过设置UA可以伪装成浏览器进行访问目标网站   3.图片识别验证码 对于一些简单的验证手段,... 阅读原文
2018-07-05 21:47:08 阅读(1877) 评论(0)
摘要:   Python的创始人为Guido van Rossum在设计上坚持了清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户所欢迎的、用途广泛的语言。 免费、开源的Python是FLOSS(自由/开放源码软件)之一。可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自... 阅读原文
2018-07-05 21:00:07 阅读(1351) 评论(0)
摘要: 此内容之前是1快速入门和2列表数据,链接已经在后面了,欢迎一起交流学习!0(≧▽≦)0: https://www.cnblogs.com/sebastiane-root/p/9175575.html 3结构化数据 字典(查找表)、集合、元组、列表 3.1字典 是有两列任意多行的表,第一列存储一个键,第二列存储一个值... 阅读原文
2018-07-05 20:28:16 阅读(1361) 评论(0)
摘要: 使用如下代码从TuShare下载沪深300每只股票的历史成交记录并按股票、日期保存到本地。主要是为了以后查询方便快速。 import numpy as np import pandas as pd import tushare as ts import datetime import time imp... 阅读原文
2018-07-05 19:00:06 阅读(1567) 评论(0)
摘要: 一、Celery入门介绍   在程序的运行过程中,我们经常会碰到一些耗时耗资源的操作,为了避免它们阻塞主程序的运行,我们经常会采用多线程或异步任务。比如,在 Web 开发中,对新用户的注册,我们通常会给他发一封激活邮件,而发邮件是个 IO 阻塞式任务,如果直接把它放到应用当中,就需要等邮件发出去之后才能进行下一步操... 阅读原文
2018-07-05 18:04:06 阅读(1411) 评论(0)
摘要: 一,编码   1.最早计算机编码为ASCII,美国人创造的,128个码位,2**7,在此基础上加了一位,2**8,包含英文字母(大小写),数字,标点等特殊字符,首位0    一个ASCII码为8位,一个字节.   2.GBK  国标码,16位,2个字节(双字节字符)   3.unicod  万国码, ucs-2 16... 阅读原文
2018-07-05 17:25:04 阅读(1705) 评论(0)
摘要: 最近在研究python爬虫的相关内容。一点一点来吧,由浅入深,稍微后面一点会搞搞分布式爬虫框架scrapy + MongoDB,现在先做一些requests + bs4的简单爬虫,稍后一点会将数据存放到数据库,这里先预定使用 mysql,而且爬取的基本是一些没有任何反扒机制的网站。 关于静态网页和动态网页的区别,以后... 阅读原文
2018-07-05 17:16:06 阅读(1373) 评论(0)
摘要: 软件主要功能: 自动化模拟登录友盟 自动排序候选版本号,并筛选前30个版本添加到目标版本号   软件界面截图:   开发环境及语言: Python3.6 PyQt5.11   更新日志:   v1.0(2018.6.30) 发布初始版本 ... 阅读原文
2018-07-05 16:51:06 阅读(1443) 评论(0)
摘要: Flask_appbuilder学习           通常对于一个后台管理项目来说,大部分的功能都是对数据进行增删改查操作, 而这些操作的代码大致是一样的,唯一变化的是数据,Flask_appbuilder就是为了减少这段重复代码而诞生。   安装 使用pip安装flask_appbuilder   pip... 阅读原文
2018-07-05 16:11:06 阅读(1328) 评论(0)