摘要: 看崔庆才爬虫教程视频做的笔记。 1.什么是爬虫? 请求网站并提取数据的自动化程序。 2.爬虫的基本流程 发送请求:通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应。 获取响应内容:如果服务器能正常响应,会得到一个Response, Respons... 阅读原文
2018-11-26 14:56:05 阅读(2742) 评论(0)
摘要: 今天在爬知乎精华时,出现了‘Forbidden by robots.txt’的问题 了解到到scrapy在爬取设定的url之前,它会先向服务器根目录请求一个txt文件,这个文件规定了爬取范围 scrapy会遵守这个范围协议,查看自己是否符合权限,出错说明不符合,所以我们只要不遵守这个协议就Ok了 在settings.... 阅读原文
2018-11-26 13:49:02 阅读(2655) 评论(0)
摘要: 让用户输入用户名密码 认证成功后显示欢迎信息 输错三次后退出程序 #自定义本地用户名和密码 user_name = 'Mifen' password = '520123' count = 1 #统计次数 #获取用户输入的数据 login = input('请输入用户名:') psd = input('请输入密码... 阅读原文
2018-11-26 11:52:02 阅读(2748) 评论(0)
摘要: 注意:以下代码均针对python3.x ,python2.x 需要把括号去掉 ,如:print ''This is the python 2. x format '' 1.print([object, ..., ]*, sep=' ', end='\n', file=sys.stdout) 输出函数 1.1 obje... 阅读原文
2018-11-26 11:33:07 阅读(2737) 评论(0)
摘要:   一、django生命周期 写中间件之前呢?还是来说说django的生命周期,我再画下图贴上来,比较清楚 1、浏览器向127.0.0.1:8000/index这个url发出一个请求 2、首先网络通信都是基于socket的,那么django一样,通过wsgiref协议来的 3、在socket对来的请求进行一系列处... 阅读原文
2018-11-26 10:51:03 阅读(2699) 评论(0)
摘要: 前言 本篇博客学习 mysql 的用户管理和使用 python 操作 mysql 的一个模块 pymysql。 mysql 用户管理 因为数据安全对于互联网公司来说是最重要的,不可能随便分配 root 账户,应该按照不同开发岗位分配不同的账户和权限。 用户管理相关表 mysql> use mysql; mysq... 阅读原文
2018-11-26 10:02:11 阅读(2824) 评论(0)
摘要: 五、商品列表页面 1、Django的view实现商品列表页面   为了区分django的view和django rest framework的view,在goods下面新建view_base.py文件,该项目采用前后端分离,所以和模板技术不一样返回的是模本文件,现在给前端返回的必须是json数据: import j... 阅读原文
2018-11-26 09:56:12 阅读(2979) 评论(0)
摘要: 1、用户登陆 i=0 while i<3: i += 1 j = 3 - i username = input("请输入姓名:") password = input("请输入密码:") if username == "小二" and password == "123... 阅读原文
2018-11-26 08:01:04 阅读(2844) 评论(0)
摘要: 一:会话技术:       1:什么是会话跟踪技术:     首先我们应该知道,什么是会话。当浏览器(客户端)第一次访问某个网站的时候(服务器)。该浏览器便和服务器建立了单独的会话。直到浏览器关闭或服务器断开。但是一个网站有许多请求,如/login/,/index/等,而http协议是一种无状态的协议,一次请求一... 阅读原文
2018-11-26 07:03:03 阅读(2772) 评论(0)
摘要: 自从上次用python写了个简易的、获取小姐姐图集的爬虫,很多人都发私信,求python的学习路径、推荐书籍、建议的教程等等。所以我这里做个小小的个人总结,把我曾经看过、我想看的、大家墙裂推荐的书籍和教程发上来,让大家能更快地掌握python,更快地去编写自己的python程序。 这个推荐清单主要是针对零基础的人。如... 阅读原文
2018-11-26 06:02:02 阅读(2606) 评论(0)