摘要: 前言 之前爬取美团,马蜂窝等网站的数据都挺顺利,大众点评(这个反爬机制有点麻烦)在磕磕绊绊中也算成功(重点是网页页数的变化和关键字的隐藏替换)但携程居然遇到了瓶颈。 主要是查看源代码时发现关键商户信息根本就找不到,就很奇怪。对于关键信息评论发现翻页时网页的url不变,网上查了一下说是使用是动态的网址进行建构的... 阅读原文
2020-08-21 18:38:05 阅读(2897) 评论(0)
摘要: requests模块的入门使用 注意是requests不是request. 1、为什么使用requests模块,而不是用python自带的urllib requests的底层实现就是urllib requests在python2 和python3中通用,方法完全一样 requests简单易用 request... 阅读原文
2020-08-21 16:58:05 阅读(2398) 评论(0)
摘要: 在解决正整数分解质因数的问题中,用了一下午的时间终于得到了结果,没想到最后却被输出的格式难到。 (将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5) 使用遍历的方式,不断调节print()都无济于事 print("该整数的因式分解结果为:") print('n = ',end='') ... 阅读原文
2020-08-21 15:29:01 阅读(2283) 评论(0)
摘要: 前言 很多免费的资源只能看但是不提供下载,今天我们以小说为例教你如何把互联网上只能看不能下载的东西给下载下来   知识点: requests css选择器 全站小说爬取思路 开发环境: 版 本:anaconda5.2.0(python3.6.5) 编辑器:pycharm 社区版 代码 导入工具 ... 阅读原文
2020-08-21 13:41:02 阅读(3628) 评论(0)
摘要: PyQt5打包成exe,双击打开的任务栏和窗口都没有显示图标。解决方案: 1、创建images.qrc文件,写入以下内容: <RCC> <qresource prefix="/"> <file>pig128.png</file> ... 阅读原文
2020-08-21 13:32:01 阅读(2839) 评论(0)
摘要: 第一步 手机启动frida服务 第二步 手机打开要脱壳的app 第三步 运行脱壳代码 # Author: hluwa <hluwa888@gmail.com> # HomePage: https://github.com/hluwa # CreatedTime: 2020/1/7 20:57 im... 阅读原文
2020-08-21 11:39:12 阅读(2425) 评论(0)
摘要:   现在拥有了正则表达式这把神兵利器,我们就可以进⾏对爬取到的全部⽹⻚源代码进⾏筛选了。下⾯我们⼀起尝试⼀下爬取内涵段⼦⽹站:http://www.neihan8.com/article/list_5_1.html打开之后,不难看到⾥⾯⼀个⼀个灰常有内涵的段⼦,当你进⾏翻⻚的时候,注意 url 地址的变化:第... 阅读原文
2020-08-21 09:48:03 阅读(2433) 评论(0)
摘要:   现在拥有了正则表达式这把神兵利器,我们就可以进⾏对爬取到的全部⽹⻚源代码进⾏筛选了。下⾯我们⼀起尝试⼀下爬取内涵段⼦⽹站:http://www.neihan8.com/article/list_5_1.html打开之后,不难看到⾥⾯⼀个⼀个灰常有内涵的段⼦,当你进⾏翻⻚的时候,注意 url 地址的变化:第... 阅读原文
2020-08-21 08:02:04 阅读(2462) 评论(0)
摘要: 前言 2019年年初,新东方年会的一个视频火爆全网,里面说出了无数职场人士的心声: 干活的累死累活,到头来干不过写PPT的! 也有网友表示:写好PPT和做好PPT在职场上就是一种能力,一份好的PPT是内容好加视觉美观。 在平时的科研过程中,我们经常会输出一些二维的平面图,二维平面图反映某个变量在二维场景下的分... 阅读原文
2020-08-21 06:44:03 阅读(2380) 评论(0)
摘要: 一、进程应用 1、multiprocessing模块介绍   python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大部分情况需要使用多进程。Python提供了    multiprocessing。    multiprocessin... 阅读原文
2020-08-21 06:40:01 阅读(2421) 评论(0)