摘要:       从上图中可以看出,我们可以获得餐厅的人均消费、点评数量、推荐菜、评分(口味、环境、服务)等信息,用于我们之后的分析。我们此次总共爬取到了225个城市,6758个餐厅,121.3万条评论。 我们截取其中的部分核心代码: def find_city_page(path): data = pd.re... 阅读原文
2018-06-22 12:16:05 阅读(1128) 评论(0)
摘要: 通过自定义Admin的模板文件实现省市区的三级联动.要求创建记录时,根据省>市>区的顺序选择依次显示对应数据. 修改记录时默认显示已存在的数据. Model class Member(models.Model): name = models.CharField(max_length=100, v... 阅读原文
2018-06-22 11:19:04 阅读(1247) 评论(0)
摘要: 今天学习内容如下: 1.学习昨天练习题目的解题新方法 1 #1、使用while循环输入 1 2 3 4 5 6 8 9 10 2 ''' 3 count = 0 4 while count < 10: 5 count += 1 # count = count + 1 6 if ... 阅读原文
2018-06-22 11:17:07 阅读(1128) 评论(0)
摘要: 1,程序要求 1 1、查 2 输入:www.oldboy.org 3 获取当前backend下的所有记录 4 5 2、新建 6 输入: 7 arg = { 8 'backend': 'www.oldboy.org', 9 ... 阅读原文
2018-06-22 10:33:05 阅读(1139) 评论(0)
摘要: 阅读目录 如何在Django终端打印SQL语句 如何在Python脚本中调用Django环境 操作方法 单表查询之神奇的下划线 ForeignKey操作 ManyToManyField 聚合查询和分组查询 一、如何在Django终端打印SQL语句 在Django项目的settings.py文... 阅读原文
2018-06-22 10:18:03 阅读(1125) 评论(0)
摘要: 0x01 写在前面 常听到很多人抱怨自己的IP因爬虫次数太多而被网站屏蔽,不得不频繁使用各种代理IP,却又因为网上的公开代理大部分都是不能使用,而又要花钱花精力去申请VIP代理,几番波折又遭屏蔽。特此写一篇如何利用Python搭建代理池的文章,以降低时间及精力成本,实现自动化获取活跃代理IP的功能。   说明①:... 阅读原文
2018-06-22 10:00:04 阅读(1157) 评论(0)
摘要: Django——连接多个数据库的实现方式     最近刚刚忙完手头的工作,所以决定把这一个项目里面的坑陆续梳理出来,一方面以后自己回顾的时候有个参考算是备忘,另一方面希望能帮到遇到跟我一样问题的兄弟。 *首先声明,我所用的版本是python3.5和Django2.0.4,公司使用的是Django,没有用restf... 阅读原文
2018-06-22 09:23:02 阅读(1158) 评论(0)
摘要:            最近快手这种小视频app,特别的火,中午吃过午饭,闲来无聊,想搞下快手的短视频,看能不能搞到。           于是乎,           打开了fiddler,开始准备抓包,                 设置代理,重启,下一步,查看本机ip       手机打开网络设置     通... 阅读原文
2018-06-22 08:49:15 阅读(1077) 评论(0)
摘要:   了解协程的过程 先通过一个简单的协程的例子理解:   对上述例子的分析: yield 的右边没有表达式,所以这里默认产出的值是None   协程在运行过程中有四个状态: GEN_CREATE:等待开始执行GEN_RUNNING:解释器正在执行,这个状态一般看不到GEN_SUSPENDED:在yiel... 阅读原文
2018-06-22 07:37:05 阅读(1340) 评论(0)
摘要:在这个例子中,主要会用到python内置的和OS模块的几个函数:    os.walk() : 该方法用来遍历指定的文件目录,返回一个三元tuple(dirpath, dirnames, filenames) ,其中dirpath为当前目录路径,dirnames为当前路径下的文件夹,filenames为当前路径下的文件... 阅读原文
2018-06-22 06:00:03 阅读(1417) 评论(0)