摘要: Python编码 python2解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),而python3对内容进行编码的默认为utf-8。 ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电... 阅读原文
2019-01-16 14:25:04 阅读(3578) 评论(0)
摘要:   阅读原文
2019-01-16 12:52:44 阅读(5786) 评论(0)
摘要:#简单def narcissus(): for n in range(100, 1000, 1): a, b, c = n//100, (n//10)%10, (n%100)%10 if a ** 3 + b ** 3 + c ** 3 == n: print(n)#使用yiel... 阅读原文
2019-01-16 12:36:16 阅读(3528) 评论(0)
摘要: 日志等级 日志信息:   使用命令:scrapy crawl 爬虫文件 运行程序时,在终端输出的就是日志信息; 日志信息的种类:   ERROR:一般错误;   WARNING:警告;   INFO:一般的信息;   DEBUG: 调试信息; 设置日志信息指定输出:   在settings配置文件... 阅读原文
2019-01-16 11:35:02 阅读(4814) 评论(0)
摘要: POST请求发送 重写爬虫应用文件中继承Spider类的 类的里面的start_requests(self)这个方法 def start_requests(self): #请求的url post_url = 'http://fanyi.baidu.com/sug' # post请... 阅读原文
2019-01-16 09:50:03 阅读(3551) 评论(0)
摘要: 我使用多进程的一般方式,都是multiprocessing模块中的Pool.map()方法。下面写一个简单的示例和解析。至于此种方法使用多进程的效率问题,还希望大佬予以指正。 示例: """ 探索pool.map多进程执行方式的实质 """ from multiprocessing import Pool fro... 阅读原文
2019-01-16 08:05:03 阅读(3505) 评论(0)
摘要: urls.py from django.urls import path from . import views app_name='front' urlpatterns = [ path('',views.index,name='index'), path('signin/',views.lo... 阅读原文
2019-01-16 06:50:53 阅读(3521) 评论(0)
摘要: 一、是什么? uWSGI是web服务器,用来部署线上web应用到生产环境。uWSGI实现了WSGI协议、uwsgi协议、http协议。WSGI(Web Server Gateway Interface)是一种web服务器网关接口。它是一个web服务器与web应用通信的一种规范  WSGI是一种通信协议,不是服务器... 阅读原文
2019-01-16 06:00:03 阅读(3670) 评论(0)
摘要: 1. 写在前面 今天要抓取的一个网站叫做微医网站,地址为 https://www.guahao.com ,我们将通过python3爬虫抓取这个网址,然后数据存储到CSV里面,为后面的一些分析类的教程做准备。本篇文章主要使用的库为pyppeteer 和 pyquery 首先找到 医生列表页 https://www.gu... 阅读原文
2019-01-16 00:06:03 阅读(3130) 评论(0)
摘要: 引用文章:https://mp.weixin.qq.com/s/NZ371nKs_WXdYPCPiryocw   切片基础法则: (1)公式[i : n : m],i为起始位置索引(当i为首位0可省略),i+n为结束位置索引(当n为长度len(li)可省略),m为步长,默认1,禁止0。 (2)i, n同号:从... 阅读原文
2019-01-15 23:47:03 阅读(2865) 评论(0)