分类
摘要:
1.前言
爬虫可以有助于快速地从网页中获取想要的信息,从而大大减少工作量今天小编就用实际案例为大家讲解如何爬取网站的一些书籍信息。
2.环境配置
Pycharm,python3,爬虫库request,re模块。
3.爬取目标
爬虫的一般思路:分析目标网页,确定urlà发送请求,获取响应à解析数据à保存数据... 阅读原文
2020-04-01 00:54:07 阅读(2474) 评论(0)
摘要:
【Part1——理论篇】
试想一个问题,如果我们要抓取某个微博大V微博的评论数据,应该怎么实现呢?最简单的做法就是找到微博评论数据接口,然后通过改变参数来获取最新数据并保存。首先从微博api寻找抓取评论的接口,如下图所示。
但是很不幸,该接口频率受限,抓不了几次就被禁了,还没有开始起飞,就凉凉了。
接下... 阅读原文
2020-04-01 00:00:13 阅读(2306) 评论(0)
摘要:
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户(初学者和高级用户)的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合,这些库使它可以保持活力和高效。
在本... 阅读原文
2020-03-31 21:59:12 阅读(2663) 评论(0)
摘要:
旋转数组
给定一个数组,将数组中的元素向右移动 k 个位置,其中 k 是非负数。
示例 1:
输入: [1,2,3,4,5,6,7] 和 k = 3
输出: [5,6,7,1,2,3,4]
解释:
向右旋转 1 步: [7,1,2,3,4,5,6]
向右旋转 2 步: [6,7,1,2,3,4,5]
向右旋转... 阅读原文
2020-03-31 21:30:02 阅读(2413) 评论(0)
摘要:
一、定义
python面对对象的继承指的是多个类之间的所属关系,即子类默认继承父类的所由属性和方法。
class A(object):
def __init__(self):
self.num=1
def info_print(self):
print(sel... 阅读原文
2020-03-31 20:48:02 阅读(2414) 评论(0)
摘要:
学习了崔大神的异步协程的使用方法,代码运行的时候出现如标题的警告很是烦人,在这里记录下解决方法。
解决方法就是在session.close()之前加await
首先看下代码:
定义一个flask服务器
from flask import Flask
import time
app = Flask(__na... 阅读原文
2020-03-31 19:51:03 阅读(2426) 评论(0)
摘要:
本题目节选自国外某top50高校Python练习题库,重点在于我们返回try语句的方法,而不是题目给出的背景。假设我们写一个程序,可以将输入的身高厘米数转化为英寸,如果遇到了负数,字母,中文等则抛出异常,并输出“Only positive numeric inputs are accepted. Please... 阅读原文
2020-03-31 19:39:02 阅读(2633) 评论(0)
摘要:
1. multiprocessing像线程一样管理进程
multiprocessing模块包含一个API,它基于threadingAPI,可以把工作划分到多个进程。有些情况下,multiprocessing可以作为临时替换取代threading来利用多个CPU内核,相应地避免Python全局解释器锁所带来的计... 阅读原文
2020-03-31 18:16:10 阅读(2439) 评论(0)
摘要:
首先我们来看一个具有异常抛出功能的程序:
def register():
username=input("please input your user name: ")
if len(username)<6:
raise Exception("the str must ... 阅读原文
2020-03-31 16:42:04 阅读(2665) 评论(0)
摘要:
不足之处,还请见谅,请指出不足。本人发布过的文章,会不断更改,力求减少错误信息。
Python安装请借鉴网址https://www.runoob.com/python/python-install.html
安装注意:(虽然上方链接已给出正规(个人认为)安装过程,但仍有不详细处。由于本人安装过一定数量的各种软... 阅读原文
2020-03-31 15:29:07 阅读(2428) 评论(0)