分类
摘要:
3.爬取优质的资源:图片、文本、视频
爬取知乎钓鱼贴\图片网站,获得福利图片。
爬取微信公众号文章,分析新媒体内容运营策略。
1.了解爬虫的基本原理及过程
2.Requests+Xpath 实现通用爬虫套路
3.了解非结构化数据的存储
4.学习scrapy,搭建工程化爬虫
5.... 阅读原文
2018-06-24 14:39:04 阅读(1210) 评论(0)
摘要:
程序分析:一个大于1的正整数,如果除了1和它本身以外,不能被其他正整数整除,就叫素数。
一、参考解法:判断素数的方法:用一个数分别去除2到sqrt(这个数),如果能被整除,则表明此数不是素数,反之是素数。
from math import sqrth=0for m in range(101,201): leap... 阅读原文
2018-06-24 13:30:02 阅读(1275) 评论(0)
摘要:
文件操作:
对文件操作流程
打开文件,得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件
现有文件如下
Somehow, it seems the love I knew was always the most destructive kind
不知为何,我经历的爱情总是最具毁灭性的的那种
Yest... 阅读原文
2018-06-24 12:30:03 阅读(1259) 评论(0)
摘要:
博主使用的是Mac系统,直接通过命令安装库:
sudo easy_install beautifulsoup4
安装完成后,尝试包含库运行:
from bs4 import BeautifulSoup
若没有报错,则说明库已正常安装完成。
开始
本文会通过这个网页http://reeoo.com来进行示例讲... 阅读原文
2018-06-24 11:20:10 阅读(1269) 评论(0)
摘要:
1.初识python
1.1python的近几年发展
在各大网址上进行了解,发现python近几年来的发展是十分迅猛,并且有继续增长的趋势,这对于一个初学者而言,其实影响不大,开始了解内部干货。
想去了解语言近几年的排名可以前往TIOBE排行榜。网址附上:https://www.tiobe.com/tiobe-ind... 阅读原文
2018-06-24 10:56:04 阅读(1258) 评论(0)
摘要:
阅读目录
常用字段
字段合集
自定义字段
字段参数
关系参数
多对多的关联关系的三种方式
一、常用字段
AutoField
int自增列,必须填入参数 primary_key=True。当model中如果没有自增列,则自动会创建一个列名为id的列。
IntegerField
一个整数类型... 阅读原文
2018-06-24 10:54:04 阅读(1220) 评论(0)
摘要:
1、请至少列举5个 PEP8 规范(越多越好)。
一、代码编排
1、缩进。4个空格的缩进,不使用Tap,更不能混合使用Tap和空格
2、每行最大长度79,换行可以使用反斜杠,最好使用圆括号。换行点要在操作符的后边敲回车
二、文档编排
1、不要在一句import中多个库,比如import 欧式,sys
三、... 阅读原文
2018-06-24 08:58:02 阅读(1242) 评论(0)
摘要:
4.1字典的简介
字典类似于java中hashmap,它的数据都是以key(键)-value(值)配对的形式储存的。这种key-value的结构也被称为映射。只用输入特定的key,就能获得对应的value。例如一个电话本的字典,以名字为key,电话号码为value。当输入名字时,就能直接获得用户的电话号码。
4.... 阅读原文
2018-06-24 08:40:07 阅读(675) 评论(0)
摘要:
三方包引入
使用到了以下包:
爬虫 scrapy
网络测试 requests
数据分析 numpy和pandas
绘图 matplotlib和wordcloud
pip install scrapypip install requestspip install numpypip install panda... 阅读原文
2018-06-24 07:21:04 阅读(1267) 评论(0)
摘要:
但是随着北京的大力治理,比如二氧化硫浓度降幅64.3%、淘汰167万辆老旧机动车、城六区整治千条背街小巷、原生垃圾实现无害化处理等等措施,北京PM2.5下降近四分之一, 我们终将赢得蓝天(来源北京娱乐信报)。
百度指数也给出了我们同样结论。数据从2013年1月到2018年6月,PM2.5指数明... 阅读原文
2018-06-24 06:00:08 阅读(1322) 评论(0)