摘要:         3.爬取优质的资源:图片、文本、视频 爬取知乎钓鱼贴\图片网站,获得福利图片。 爬取微信公众号文章,分析新媒体内容运营策略。   1.了解爬虫的基本原理及过程 2.Requests+Xpath 实现通用爬虫套路 3.了解非结构化数据的存储 4.学习scrapy,搭建工程化爬虫 5.... 阅读原文
2018-06-24 14:39:04 阅读(1210) 评论(0)
摘要: 程序分析:一个大于1的正整数,如果除了1和它本身以外,不能被其他正整数整除,就叫素数。 一、参考解法:判断素数的方法:用一个数分别去除2到sqrt(这个数),如果能被整除,则表明此数不是素数,反之是素数。 from math import sqrth=0for m in range(101,201):    leap... 阅读原文
2018-06-24 13:30:02 阅读(1275) 评论(0)
摘要: 文件操作: 对文件操作流程 打开文件,得到文件句柄并赋值给一个变量 通过句柄对文件进行操作 关闭文件 现有文件如下 Somehow, it seems the love I knew was always the most destructive kind 不知为何,我经历的爱情总是最具毁灭性的的那种 Yest... 阅读原文
2018-06-24 12:30:03 阅读(1259) 评论(0)
摘要:   博主使用的是Mac系统,直接通过命令安装库: sudo easy_install beautifulsoup4 安装完成后,尝试包含库运行: from bs4 import BeautifulSoup 若没有报错,则说明库已正常安装完成。 开始 本文会通过这个网页http://reeoo.com来进行示例讲... 阅读原文
2018-06-24 11:20:10 阅读(1269) 评论(0)
摘要: 1.初识python 1.1python的近几年发展 在各大网址上进行了解,发现python近几年来的发展是十分迅猛,并且有继续增长的趋势,这对于一个初学者而言,其实影响不大,开始了解内部干货。 想去了解语言近几年的排名可以前往TIOBE排行榜。网址附上:https://www.tiobe.com/tiobe-ind... 阅读原文
2018-06-24 10:56:04 阅读(1258) 评论(0)
摘要: 阅读目录 常用字段 字段合集 自定义字段 字段参数 关系参数 多对多的关联关系的三种方式 一、常用字段 AutoField int自增列,必须填入参数 primary_key=True。当model中如果没有自增列,则自动会创建一个列名为id的列。 IntegerField 一个整数类型... 阅读原文
2018-06-24 10:54:04 阅读(1220) 评论(0)
摘要: 1、请至少列举5个 PEP8 规范(越多越好)。 一、代码编排 1、缩进。4个空格的缩进,不使用Tap,更不能混合使用Tap和空格 2、每行最大长度79,换行可以使用反斜杠,最好使用圆括号。换行点要在操作符的后边敲回车 二、文档编排 1、不要在一句import中多个库,比如import 欧式,sys 三、... 阅读原文
2018-06-24 08:58:02 阅读(1242) 评论(0)
摘要: 4.1字典的简介 字典类似于java中hashmap,它的数据都是以key(键)-value(值)配对的形式储存的。这种key-value的结构也被称为映射。只用输入特定的key,就能获得对应的value。例如一个电话本的字典,以名字为key,电话号码为value。当输入名字时,就能直接获得用户的电话号码。   4.... 阅读原文
2018-06-24 08:40:07 阅读(675) 评论(0)
摘要:   三方包引入 使用到了以下包: 爬虫 scrapy 网络测试 requests 数据分析 numpy和pandas 绘图 matplotlib和wordcloud pip install scrapypip install requestspip install numpypip install panda... 阅读原文
2018-06-24 07:21:04 阅读(1267) 评论(0)
摘要:       但是随着北京的大力治理,比如二氧化硫浓度降幅64.3%、淘汰167万辆老旧机动车、城六区整治千条背街小巷、原生垃圾实现无害化处理等等措施,北京PM2.5下降近四分之一, 我们终将赢得蓝天(来源北京娱乐信报)。 百度指数也给出了我们同样结论。数据从2013年1月到2018年6月,PM2.5指数明... 阅读原文
2018-06-24 06:00:08 阅读(1322) 评论(0)