分类
摘要:
看崔庆才爬虫教程视频做的笔记。
1.什么是爬虫?
请求网站并提取数据的自动化程序。
2.爬虫的基本流程
发送请求:通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应。
获取响应内容:如果服务器能正常响应,会得到一个Response, Respons... 阅读原文
2018-11-26 14:56:05 阅读(2742) 评论(0)
摘要:
今天在爬知乎精华时,出现了‘Forbidden by robots.txt’的问题
了解到到scrapy在爬取设定的url之前,它会先向服务器根目录请求一个txt文件,这个文件规定了爬取范围
scrapy会遵守这个范围协议,查看自己是否符合权限,出错说明不符合,所以我们只要不遵守这个协议就Ok了
在settings.... 阅读原文
2018-11-26 13:49:02 阅读(2655) 评论(0)
摘要:
让用户输入用户名密码
认证成功后显示欢迎信息
输错三次后退出程序
#自定义本地用户名和密码
user_name = 'Mifen'
password = '520123'
count = 1 #统计次数
#获取用户输入的数据
login = input('请输入用户名:')
psd = input('请输入密码... 阅读原文
2018-11-26 11:52:02 阅读(2748) 评论(0)
摘要:
注意:以下代码均针对python3.x ,python2.x 需要把括号去掉 ,如:print ''This is the python 2. x format ''
1.print([object, ..., ]*, sep=' ', end='\n', file=sys.stdout) 输出函数
1.1 obje... 阅读原文
2018-11-26 11:33:07 阅读(2737) 评论(0)
摘要:
一、django生命周期
写中间件之前呢?还是来说说django的生命周期,我再画下图贴上来,比较清楚
1、浏览器向127.0.0.1:8000/index这个url发出一个请求
2、首先网络通信都是基于socket的,那么django一样,通过wsgiref协议来的
3、在socket对来的请求进行一系列处... 阅读原文
2018-11-26 10:51:03 阅读(2699) 评论(0)
摘要:
前言
本篇博客学习 mysql 的用户管理和使用 python 操作 mysql 的一个模块 pymysql。
mysql 用户管理
因为数据安全对于互联网公司来说是最重要的,不可能随便分配 root 账户,应该按照不同开发岗位分配不同的账户和权限。
用户管理相关表
mysql> use mysql;
mysq... 阅读原文
2018-11-26 10:02:11 阅读(2824) 评论(0)
摘要:
五、商品列表页面
1、Django的view实现商品列表页面
为了区分django的view和django rest framework的view,在goods下面新建view_base.py文件,该项目采用前后端分离,所以和模板技术不一样返回的是模本文件,现在给前端返回的必须是json数据:
import j... 阅读原文
2018-11-26 09:56:12 阅读(2979) 评论(0)
摘要:
1、用户登陆
i=0
while i<3:
i += 1
j = 3 - i
username = input("请输入姓名:")
password = input("请输入密码:")
if username == "小二" and password == "123... 阅读原文
2018-11-26 08:01:04 阅读(2844) 评论(0)
摘要:
一:会话技术:
1:什么是会话跟踪技术:
首先我们应该知道,什么是会话。当浏览器(客户端)第一次访问某个网站的时候(服务器)。该浏览器便和服务器建立了单独的会话。直到浏览器关闭或服务器断开。但是一个网站有许多请求,如/login/,/index/等,而http协议是一种无状态的协议,一次请求一... 阅读原文
2018-11-26 07:03:03 阅读(2772) 评论(0)
摘要:
自从上次用python写了个简易的、获取小姐姐图集的爬虫,很多人都发私信,求python的学习路径、推荐书籍、建议的教程等等。所以我这里做个小小的个人总结,把我曾经看过、我想看的、大家墙裂推荐的书籍和教程发上来,让大家能更快地掌握python,更快地去编写自己的python程序。
这个推荐清单主要是针对零基础的人。如... 阅读原文
2018-11-26 06:02:02 阅读(2606) 评论(0)