分类
摘要:
接下来我将会用一段时间来更新python爬虫
网络爬虫大体可以分为三个步骤。
首先建立请求,爬取所需元素;
其次解析爬取信息,剔除无效数据;
最后将爬取信息进行保存;
今天就先来讲讲第一步,请求库requests
request库主要有七个常用函数,如下所示
而通过requests创建的数据类型为r... 阅读原文
2019-11-25 00:01:05 阅读(2322) 评论(0)
摘要:
相信在大家的印象里,想进入金融行业或者数据岗位,首先需要精通Excel。
ps:本文来源于网络然而野村证券副首席数字官马修·汉普森在上周五的伦敦Quant Conference上发表讲话:
“现在走进交易大厅,用Excel的人越来越少,大家都在码Python代码”
甚至直接说:
“ Python已经取代了... 阅读原文
2019-11-24 23:39:07 阅读(2490) 评论(0)
摘要:
有序化
以小说章节目录的数字为文件名,一章一个文件(但上千章就得有上千个文件)
在每次获取小说章节里的内容时,给item添加新的标识,添加对应的章节的数字,全部存入数据库,然后根据这个数字标识排序取出数据即可(没打印小说内容的字段)
去空行
利用splitlines()和strip()
str.sp... 阅读原文
2019-11-24 23:15:03 阅读(2330) 评论(0)
摘要:
题目:无重复字符的最长子串。
给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。
示例 1:
输入: “abcabcbb”
输出: 3
解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。
示例 2:
输入: “bbbbb”
输出: 1
解释: 因为无重复字符的最长子串是 “b”,... 阅读原文
2019-11-24 23:04:01 阅读(2824) 评论(0)
摘要:
数据的排序是在解决实际问题时经常用到的步骤,也是数据结构的考点之一,下面介绍10种经典的排序方法。
首先,排序方法可以大体分为插入排序、选择排序、交换排序、归并排序和桶排序四大类,其中,插入排序又分为直接插入排序、二分插入排序和希尔排序,选择排序分为直接选择排序和堆排序,交换排序分为冒泡排序和快速排序... 阅读原文
2019-11-24 22:53:05 阅读(2737) 评论(0)
摘要:
在Python函数中,传递的参数如果默认有一个为 列表(list),那么就要注意了,此处有坑.
入坑
挖坑
def f(x,li=[]):
for i in range(x):
li.append(i*i)
print(li)
print('---1---')
f(4)
p... 阅读原文
2019-11-24 21:20:02 阅读(2422) 评论(0)
摘要:
前言文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者: Rocky0429
在学习 Python 的过程中,我为它的简洁优雅而痴迷,但它又是如此的调皮,在提供了很多舒服的功能特性之外,又悄悄挖了很多带有迷惑性的坑,令人防... 阅读原文
2019-11-24 19:19:04 阅读(2404) 评论(0)
摘要:
面试实习生的时候,当问到 is 和 == 的区别时,很多同学都答不上来,搞不清两者什么时候返回一致,什么时候返回不一致。本文我们来看一下这两者的区别。
我们先来看几个例子:
a = "hello"
b = "hello"
print(a is b) # 输出 True
print(a == b) # 输... 阅读原文
2019-11-24 17:36:18 阅读(2754) 评论(0)
摘要:
1. 介绍
RabbitMQ是一个消息代理 - 一个消息系统的媒介。它的工作就是接收和转发消息。你可以把他想象成一个邮局,你把信件都放到这个邮箱中,邮递员叔叔就会把信件投递到你的收件人处。只是邮箱中放的是你的信件,而我们要使用的RabbitMQ中存放的是我们的二进制数据。
下面是RabbitMQ和消息所涉及到... 阅读原文
2019-11-24 16:29:11 阅读(2319) 评论(0)
摘要:
目录
一:极验滑动验证码简介
二:极验滑动验证码识别思路
三:极验验证码识别
一:极验滑动验证码简介
近些年来出现了一些新型验证码,不想旧的验证码对人类不友好,但是这种验证码对于代码来说识别难度上升了几个等级。因此... 阅读原文
2019-11-24 16:08:03 阅读(2453) 评论(0)