摘要: #进度条的效果 [# ] [## ] [### ] [#### ] #指定宽度 print('[%-15s]' %'#') print('[%-15s]' %'##') print('[%-15s]' %'###') print(... 阅读原文
2019-01-18 12:37:01 阅读(3876) 评论(0)
摘要: pandas入门 统计分析是数据分析的重要组成部分,它几乎贯穿整个数据分析的流程。运用统计方法,将定量与定性结合,进行的研究活动叫做统计分析。而pandas是统计分析的重要库。 1.pandas数据结构     在pandas中,有两个常用的数据结构:Series和Dataframe  为大多数应用提供了一个有效、易... 阅读原文
2019-01-18 10:27:04 阅读(3450) 评论(0)
摘要:  本实例综合运用了列表、字典、元祖以及for循环、while循环和if-else语句,是入门同学比较经典的事例之一。 china_ditie = {"北京": { "一号线": ["四惠", "大望路", "天安门", "西单"], "二号线": ["北京站", "朝阳门", "东直门", "西直门"]... 阅读原文
2019-01-18 08:07:02 阅读(2839) 评论(0)
摘要: 列表 列表是python中最基本的数据结构之一,并且列表的数据项不需要具有相同的数据类型,创建一个列表,只需把逗号分隔的不同数据项使用方括号括起来即可。具体的定义式如下: list=['变量1','变量2','变量3'......] #变量可以是字符串也可以是数字,是数字时可以直接去掉引号 我们在使用列表时可以... 阅读原文
2019-01-18 06:06:02 阅读(2792) 评论(0)
摘要: 列表——元组——字典——集合: 列表: # 一:基本使用# 1、用途:存放多个值# 定义方式:[]内以逗号为分隔多个元素,列表内元素无类型限制# l=['a','b','c'] #l=list(['a','b','c'])# l1=list('hello')# print(l1)# 常用操作+内置的方法# 按索引... 阅读原文
2019-01-17 23:42:02 阅读(2689) 评论(0)
摘要: 1. 知乎文章图片爬取器之二博客背景 昨天写了知乎文章图片爬取器的一部分代码,针对知乎问题的答案json进行了数据抓取,博客中出现了部分写死的内容,今天把那部分信息调整完毕,并且将图片下载完善到代码中去。 首先,需要获取任意知乎的问题,只需要你输入问题的ID,就可以获取相关的页面信息,比如最重要的合计有多少人回答问题... 阅读原文
2019-01-17 22:08:12 阅读(2777) 评论(0)
摘要: 1. 知乎文章图片爬取器之二博客背景 昨天写了知乎文章图片爬取器的一部分代码,针对知乎问题的答案json进行了数据抓取,博客中出现了部分写死的内容,今天把那部分信息调整完毕,并且将图片下载完善到代码中去。 首先,需要获取任意知乎的问题,只需要你输入问题的ID,就可以获取相关的页面信息,比如最重要的合计有多少人回答问题... 阅读原文
2019-01-17 22:08:10 阅读(3449) 评论(0)
摘要:   在前面有篇博客,我写了一个叫forms组件的东西,可以帮助我们完成校验数据、渲染标签功能和在前端页面局部刷新功能,功能封装的已经很好了,当时已经很开心了。但万万没想到,还有比它功能更强大的东西。forms组件只能渲染出type=text类型的标签,而且还要我们写无数多个字段,然后跟上校验条件,用forms组件做编... 阅读原文
2019-01-17 19:53:38 阅读(3003) 评论(0)
摘要: 1. 有一个已经排好序的列表。现输入一个数,要求按原来的规律将它插入列表中 分析:已经排好序的列表也可能是升序也可能是降序,需要先确定列表的排序方式以升序为例,需要考虑4主要种情况: Case1:小于列表的第一个值,则插入第一个 如s=[2,3,4],插入1,则结果应该为[1,2,3,4],1插入的位置应该为第0个 ... 阅读原文
2019-01-17 19:39:02 阅读(2806) 评论(0)
摘要: 基于终端指令的持久化存储   保证爬虫文件的parse方法中有可迭代类型对象(通常为列表or字典)的返回,该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作; 执行输出指定格式进行存储:将爬取到的数据写入不同格式的文件中进行存储 scrapy crawl 爬虫名称 -o xxx.jso... 阅读原文
2019-01-17 18:36:33 阅读(2589) 评论(0)