摘要: 前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。 小编闲暇时喜欢看热点,会收集微博,... 阅读原文
2020-06-03 09:22:04 阅读(1946) 评论(0)
摘要: 来自基友的一个问题: 用python实现 输入是一个二维list,一个可能的输入如下所示: Input_list = [         [”china”,”is”,”a”,”great”,”country”],           [“usa”,”always”,”korea”], [“korea”,”ha... 阅读原文
2020-06-03 08:45:02 阅读(1207) 评论(0)
摘要: from urllib import request #网上很多说的urllib2,在python3中其实就是urllib.request proxy_support = request.ProxyHandler({'http':'http://username:password@IP:port'}) aut... 阅读原文
2020-06-03 08:26:02 阅读(1967) 评论(0)
摘要: 前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 本文继续采用PyEcharts v1.x版本进行绘制地图。 注:PyEcharts分为 v0.5.x 和 v1.x 两个大版本,v0.5.x 和 v1.x 间不兼容,v0.5.x是基于... 阅读原文
2020-06-03 06:42:05 阅读(1882) 评论(0)
摘要: 搜索引擎用的很频繁,现在利用Python爬虫提取百度搜索内容,同时再进一步提取内容分析就可以简便搜索过程。详细案例如下: ​ 完整代码: # coding=utf8 import urllib2 import string import urllib import re import random #设置多个... 阅读原文
2020-06-03 06:00:08 阅读(1980) 评论(0)
摘要:   urlopen函数urllib2.urlopen(url[, data[, timeout[, cafile[, capath[, cadefault[, context]]]]])注:url表示目标网页地址,可以是字符串,也可以是请求对象Requestreq= urllib2.Request(url... 阅读原文
2020-06-03 00:10:03 阅读(2234) 评论(0)
摘要:   Beautiful Soup 库一般被称为bs4库,支持Python3,是我们写爬虫非常好的第三方库。因用起来十分的简便流畅。所以也被人叫做“美味汤”。目前bs4库的最新版本是4.60。下文会介绍该库的最基本的使用,具体详细的细节还是要看:[官方文档](Beautiful Soup Documenta... 阅读原文
2020-06-02 23:31:05 阅读(2301) 评论(0)
摘要:   什么是Selenium? Selenium相当于是一个机器人,可以模拟人类在浏览器上的一些行为,比如点击,填充数据,删除cookie等。我们可以利用这项技术来完成动态网页的爬虫。 环境的配置 1.下载对应浏览器的驱动。 2.Python安装selenium库。 以谷歌浏览器为例: (1)检查自己谷歌浏... 阅读原文
2020-06-02 22:53:07 阅读(1904) 评论(0)
摘要: 用户访问频率控制源码剖析,和用户登录验证有点相似,但是为了增加记忆,有必要再一次添加, 注意:一定要跟着博主的解说再看代码的中文注释及其下面的一行代码!!! 1、准备一个路由和视图类,全局路由配置暂时忽略,当流程执行到下面的url:groupsSelectAll——> GroupsView的视图类下的a... 阅读原文
2020-06-02 21:11:05 阅读(2185) 评论(0)
摘要:   爬虫——GET请求和POST请求 urllib.parse.urlencode()和urllib.parse.unquote() 编码工作使用urllib.parse的urlencode()函数,帮我们将key:value这样的键值对转换成"key=value"这样的字符串,解码工作可以使用urlli... 阅读原文
2020-06-02 19:54:02 阅读(1960) 评论(0)