分类
摘要:
百度百科上关于正则表达式的解释:
例:判断是否是手机号码
未采用正则表达式
re模块介绍
常用函数
re.match()函数:扫描整个字符串,返回从起始位置成功的匹配
语法:re.match(pattern, string, flags=0)
pattern 匹配的正则表达式;string ... 阅读原文
2018-07-05 22:59:06 阅读(1602) 评论(0)
摘要:
常见的反爬策略
首先,既然要破解这些常见的反爬策略,就首先需要知道常见的反爬策略有哪些,所谓知己知彼,百战百胜。
解决策略
1. 伪装user agent
User-Agent是检查用户所用客户端的种类和版本。通过设置UA可以伪装成浏览器进行访问目标网站
3.图片识别验证码
对于一些简单的验证手段,... 阅读原文
2018-07-05 21:47:08 阅读(1877) 评论(0)
摘要:
Python的创始人为Guido van Rossum在设计上坚持了清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户所欢迎的、用途广泛的语言。
免费、开源的Python是FLOSS(自由/开放源码软件)之一。可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自... 阅读原文
2018-07-05 21:00:07 阅读(1351) 评论(0)
摘要:
此内容之前是1快速入门和2列表数据,链接已经在后面了,欢迎一起交流学习!0(≧▽≦)0:
https://www.cnblogs.com/sebastiane-root/p/9175575.html
3结构化数据
字典(查找表)、集合、元组、列表
3.1字典
是有两列任意多行的表,第一列存储一个键,第二列存储一个值... 阅读原文
2018-07-05 20:28:16 阅读(1361) 评论(0)
摘要:
使用如下代码从TuShare下载沪深300每只股票的历史成交记录并按股票、日期保存到本地。主要是为了以后查询方便快速。
import numpy as np
import pandas as pd
import tushare as ts
import datetime
import time
imp... 阅读原文
2018-07-05 19:00:06 阅读(1567) 评论(0)
摘要:
一、Celery入门介绍
在程序的运行过程中,我们经常会碰到一些耗时耗资源的操作,为了避免它们阻塞主程序的运行,我们经常会采用多线程或异步任务。比如,在 Web 开发中,对新用户的注册,我们通常会给他发一封激活邮件,而发邮件是个 IO 阻塞式任务,如果直接把它放到应用当中,就需要等邮件发出去之后才能进行下一步操... 阅读原文
2018-07-05 18:04:06 阅读(1411) 评论(0)
摘要:
一,编码
1.最早计算机编码为ASCII,美国人创造的,128个码位,2**7,在此基础上加了一位,2**8,包含英文字母(大小写),数字,标点等特殊字符,首位0
一个ASCII码为8位,一个字节.
2.GBK 国标码,16位,2个字节(双字节字符)
3.unicod 万国码, ucs-2 16... 阅读原文
2018-07-05 17:25:04 阅读(1705) 评论(0)
摘要:
最近在研究python爬虫的相关内容。一点一点来吧,由浅入深,稍微后面一点会搞搞分布式爬虫框架scrapy + MongoDB,现在先做一些requests + bs4的简单爬虫,稍后一点会将数据存放到数据库,这里先预定使用 mysql,而且爬取的基本是一些没有任何反扒机制的网站。
关于静态网页和动态网页的区别,以后... 阅读原文
2018-07-05 17:16:06 阅读(1373) 评论(0)
摘要:
软件主要功能:
自动化模拟登录友盟
自动排序候选版本号,并筛选前30个版本添加到目标版本号
软件界面截图:
开发环境及语言:
Python3.6
PyQt5.11
更新日志:
v1.0(2018.6.30)
发布初始版本
... 阅读原文
2018-07-05 16:51:06 阅读(1443) 评论(0)
摘要:
Flask_appbuilder学习
通常对于一个后台管理项目来说,大部分的功能都是对数据进行增删改查操作, 而这些操作的代码大致是一样的,唯一变化的是数据,Flask_appbuilder就是为了减少这段重复代码而诞生。
安装
使用pip安装flask_appbuilder
pip... 阅读原文
2018-07-05 16:11:06 阅读(1328) 评论(0)