分类
摘要:
作业要求:
取出一个新闻列表页的全部新闻 包装成函数。
获取总的新闻篇数,算出新闻总页数。
获取全部新闻列表页的全部新闻详情。
找一个自己感兴趣的主题,进行数据爬取,并进行分词分析。不能与其它同学雷同。
前三个要求代码如下:
import requests
from bs4 import BeautifulSou... 阅读原文
2018-04-12 00:00:03 阅读(775) 评论(0)
摘要:
python简介
Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、... 阅读原文
2018-04-11 20:01:28 阅读(760) 评论(0)
摘要:
学习知识点:
1. string.join(seq): 以string字符串作为分隔符,将seq的所有元素拼接成一个新的字符串
1 s = ['%d * %d = %d' % (y, 4, 4*y) for y in range(1, 5)]
2 print('\t'.join(s))
3
Vie... 阅读原文
2018-04-11 18:40:06 阅读(775) 评论(0)
摘要:
1、前言
最近(2018.4.1)在百忙之中开通了博客,就喜欢能够把自己所学所想沉淀下来,这篇是我开始系统学习python,称为数据分析师和算法工程师之路的计划,望有志于为同样目标奋斗的数据猿一起交流和学习。
2、Python学习计划
2.1 学习计划
(1)找一本浅显易懂,例程比较好的教程,从头到尾看下去。不要看很... 阅读原文
2018-04-11 17:41:13 阅读(816) 评论(0)
摘要:
我们首先了解下什么是闭包
在一个内部函数里,对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就被认为是闭包(closure)。
闭包 = 内部函数 + 定义函数时的环境
def outer():
a = 8
def inner(): # 条件一: inner就是... 阅读原文
2018-04-11 16:59:03 阅读(721) 评论(0)
摘要:
安装qrcode库和PIL库
在命令行中分别输入pip install qrcode 和pip install pillow
导入库格式如下:
import PIL
import qrcode
下面以生成一个带图标的二维码为例
from PIL import Image
import qrcode
qr = qrco... 阅读原文
2018-04-11 16:37:03 阅读(777) 评论(0)
摘要:
学习目的:
解决AJAX请求的爬虫,网页解析库的学习,MongoDB的简单应用
正式步骤
Step1:流程分析
抓取单页内容:利用requests请求目标站点,得到单个页面的html代码,返回结果;
抓取页面详情内容:解析返回结果,得到详情页的链接,并进一步抓取详情页的信息;
下载图片并保... 阅读原文
2018-04-11 14:39:02 阅读(729) 评论(0)
摘要:
最近在学Python,尝试着用for和while循环做一个简单的学生管理系统,现在遇到的问题是没法限定输入的数据类型和从for循环中跳出
第一个限定是:如果没有没有输入整数,程序直接报错,在其中使用了转换,代码18行
第二个跳出for循环:目的是要对录入的信息进行一个初步的判断,确保关键信息不重复
这个管理系... 阅读原文
2018-04-11 14:34:04 阅读(773) 评论(0)
摘要:
学习目的:
通过一个一个简单的爬虫应用,初窥门径。
正式步骤
Step1:流程框架
抓取单页内容:利用requests请求目标站点,得到单个页面的html代码,返回结果;
正则表达式分析:根据html页面代码分析得到猫眼电影的名称、主演、上映时间、评分、图片信息等;
保存至文件:通... 阅读原文
2018-04-11 14:26:02 阅读(759) 评论(0)
摘要:
1.基本继承图解
1.1实例化一个Contact类的对象c
1.2实例化一个Supplier类的对象s
1.3访问对象的属性
1.4访问对象s的方法
1.5类变量详解
如果从新定义c.all_contacts = "xxxxxx";那么,对象c拥有一个新的属性all_contacts,其值为"xxxxxx... 阅读原文
2018-04-11 13:33:05 阅读(767) 评论(0)