分类
摘要:
从上图中可以看出,我们可以获得餐厅的人均消费、点评数量、推荐菜、评分(口味、环境、服务)等信息,用于我们之后的分析。我们此次总共爬取到了225个城市,6758个餐厅,121.3万条评论。
我们截取其中的部分核心代码:
def find_city_page(path): data = pd.re... 阅读原文
2018-06-22 12:16:05 阅读(1128) 评论(0)
摘要:
通过自定义Admin的模板文件实现省市区的三级联动.要求创建记录时,根据省>市>区的顺序选择依次显示对应数据.
修改记录时默认显示已存在的数据.
Model
class Member(models.Model):
name = models.CharField(max_length=100, v... 阅读原文
2018-06-22 11:19:04 阅读(1247) 评论(0)
摘要:
今天学习内容如下:
1.学习昨天练习题目的解题新方法
1 #1、使用while循环输入 1 2 3 4 5 6 8 9 10
2 '''
3 count = 0
4 while count < 10:
5 count += 1 # count = count + 1
6 if ... 阅读原文
2018-06-22 11:17:07 阅读(1128) 评论(0)
摘要:
1,程序要求
1 1、查
2 输入:www.oldboy.org
3 获取当前backend下的所有记录
4
5 2、新建
6 输入:
7 arg = {
8 'backend': 'www.oldboy.org',
9 ... 阅读原文
2018-06-22 10:33:05 阅读(1139) 评论(0)
摘要:
阅读目录
如何在Django终端打印SQL语句
如何在Python脚本中调用Django环境
操作方法
单表查询之神奇的下划线
ForeignKey操作
ManyToManyField
聚合查询和分组查询
一、如何在Django终端打印SQL语句
在Django项目的settings.py文... 阅读原文
2018-06-22 10:18:03 阅读(1125) 评论(0)
摘要:
0x01 写在前面
常听到很多人抱怨自己的IP因爬虫次数太多而被网站屏蔽,不得不频繁使用各种代理IP,却又因为网上的公开代理大部分都是不能使用,而又要花钱花精力去申请VIP代理,几番波折又遭屏蔽。特此写一篇如何利用Python搭建代理池的文章,以降低时间及精力成本,实现自动化获取活跃代理IP的功能。
说明①:... 阅读原文
2018-06-22 10:00:04 阅读(1157) 评论(0)
摘要:
Django——连接多个数据库的实现方式
最近刚刚忙完手头的工作,所以决定把这一个项目里面的坑陆续梳理出来,一方面以后自己回顾的时候有个参考算是备忘,另一方面希望能帮到遇到跟我一样问题的兄弟。
*首先声明,我所用的版本是python3.5和Django2.0.4,公司使用的是Django,没有用restf... 阅读原文
2018-06-22 09:23:02 阅读(1158) 评论(0)
摘要:
最近快手这种小视频app,特别的火,中午吃过午饭,闲来无聊,想搞下快手的短视频,看能不能搞到。
于是乎,
打开了fiddler,开始准备抓包,
设置代理,重启,下一步,查看本机ip
手机打开网络设置
通... 阅读原文
2018-06-22 08:49:15 阅读(1077) 评论(0)
摘要:
了解协程的过程
先通过一个简单的协程的例子理解:
对上述例子的分析:
yield 的右边没有表达式,所以这里默认产出的值是None
协程在运行过程中有四个状态:
GEN_CREATE:等待开始执行GEN_RUNNING:解释器正在执行,这个状态一般看不到GEN_SUSPENDED:在yiel... 阅读原文
2018-06-22 07:37:05 阅读(1340) 评论(0)
摘要:在这个例子中,主要会用到python内置的和OS模块的几个函数: os.walk() : 该方法用来遍历指定的文件目录,返回一个三元tuple(dirpath, dirnames, filenames) ,其中dirpath为当前目录路径,dirnames为当前路径下的文件夹,filenames为当前路径下的文件... 阅读原文
2018-06-22 06:00:03 阅读(1417) 评论(0)