摘要: 作业要求: 取出一个新闻列表页的全部新闻 包装成函数。 获取总的新闻篇数,算出新闻总页数。 获取全部新闻列表页的全部新闻详情。 找一个自己感兴趣的主题,进行数据爬取,并进行分词分析。不能与其它同学雷同。 前三个要求代码如下: import requests from bs4 import BeautifulSou... 阅读原文
2018-04-12 00:00:03 阅读(775) 评论(0)
摘要: python简介 Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、... 阅读原文
2018-04-11 20:01:28 阅读(760) 评论(0)
摘要: 学习知识点: 1. string.join(seq): 以string字符串作为分隔符,将seq的所有元素拼接成一个新的字符串 1 s = ['%d * %d = %d' % (y, 4, 4*y) for y in range(1, 5)] 2 print('\t'.join(s)) 3 Vie... 阅读原文
2018-04-11 18:40:06 阅读(775) 评论(0)
摘要: 1、前言 最近(2018.4.1)在百忙之中开通了博客,就喜欢能够把自己所学所想沉淀下来,这篇是我开始系统学习python,称为数据分析师和算法工程师之路的计划,望有志于为同样目标奋斗的数据猿一起交流和学习。 2、Python学习计划 2.1 学习计划 (1)找一本浅显易懂,例程比较好的教程,从头到尾看下去。不要看很... 阅读原文
2018-04-11 17:41:13 阅读(816) 评论(0)
摘要: 我们首先了解下什么是闭包 在一个内部函数里,对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就被认为是闭包(closure)。 闭包 = 内部函数 + 定义函数时的环境 def outer(): a = 8 def inner(): # 条件一: inner就是... 阅读原文
2018-04-11 16:59:03 阅读(721) 评论(0)
摘要: 安装qrcode库和PIL库 在命令行中分别输入pip install qrcode 和pip install pillow 导入库格式如下: import PIL import qrcode 下面以生成一个带图标的二维码为例 from PIL import Image import qrcode qr = qrco... 阅读原文
2018-04-11 16:37:03 阅读(777) 评论(0)
摘要: 学习目的:    解决AJAX请求的爬虫,网页解析库的学习,MongoDB的简单应用   正式步骤 Step1:流程分析  抓取单页内容:利用requests请求目标站点,得到单个页面的html代码,返回结果; 抓取页面详情内容:解析返回结果,得到详情页的链接,并进一步抓取详情页的信息; 下载图片并保... 阅读原文
2018-04-11 14:39:02 阅读(729) 评论(0)
摘要: 最近在学Python,尝试着用for和while循环做一个简单的学生管理系统,现在遇到的问题是没法限定输入的数据类型和从for循环中跳出   第一个限定是:如果没有没有输入整数,程序直接报错,在其中使用了转换,代码18行   第二个跳出for循环:目的是要对录入的信息进行一个初步的判断,确保关键信息不重复 这个管理系... 阅读原文
2018-04-11 14:34:04 阅读(773) 评论(0)
摘要: 学习目的:    通过一个一个简单的爬虫应用,初窥门径。   正式步骤   Step1:流程框架  抓取单页内容:利用requests请求目标站点,得到单个页面的html代码,返回结果; 正则表达式分析:根据html页面代码分析得到猫眼电影的名称、主演、上映时间、评分、图片信息等; 保存至文件:通... 阅读原文
2018-04-11 14:26:02 阅读(759) 评论(0)
摘要: 1.基本继承图解 1.1实例化一个Contact类的对象c 1.2实例化一个Supplier类的对象s 1.3访问对象的属性 1.4访问对象s的方法 1.5类变量详解 如果从新定义c.all_contacts = "xxxxxx";那么,对象c拥有一个新的属性all_contacts,其值为"xxxxxx... 阅读原文
2018-04-11 13:33:05 阅读(767) 评论(0)