分类
摘要:
防盗链原理
http标准协议中有专门的字段记录referer
一来可以追溯上一个入站地址是什么
二来对于资源文件,可以跟踪到包含显示他的网页地址是什么
因此所有防盗链方法都是基于这个Referer字段
so:很多网站使用防盗链的方法来设置反爬虫机制,设置这种机制后通过图片路由直接访问会返回40... 阅读原文
2019-08-07 08:23:03 阅读(2432) 评论(0)
摘要:
最近,Python编程语言出现了意想不到的变化,经过一些预测之后,它将成为世界上最领先的编程语言。
正如我们所看到的,数以百万计的人正在使用Python,并且几乎没有迹象表明用户的指数增长正在逐渐减少,并且对这种增长的可持续性存在疑问。
最近的Python语言峰会警告说,如果对移动和新web平台的支持得不到改善,... 阅读原文
2019-08-07 07:51:02 阅读(2352) 评论(0)
摘要:
前言
其实很简短就是利用爬虫的第三方库Requests与BeautifulSoup。
其实就几行代码,但希望没有开发基础的人也能一下子看明白,所以大神请绕行。
基本环境配置
python 版本:2.7
IDE :pycharm
相关模块
import urllib2
import io
import rand... 阅读原文
2019-08-07 06:00:11 阅读(2410) 评论(0)
摘要:
零基础学习pythonDay1
1.首先介绍一下python
Python的优缺点
Python的优点很多,简单的可以总结为以下几点。
简单和明确,做一件事只有一种方法。
学习曲线低,跟其他很多语言相比,Python更容易上手。
开放源代码,拥有强大的社区和生态圈。
解释型语言,天生具有平台可移植性。
... 阅读原文
2019-08-07 00:44:05 阅读(2412) 评论(0)
摘要:
类的使用示例:
class Student:
name="" #类的成员变量,公有的
age=0 #python中定义变量时必须要赋值
def __init__(self,name,age): #构造函数
self.name=name
... 阅读原文
2019-08-07 00:34:01 阅读(2549) 评论(0)
摘要:
设置ip代理是爬虫必不可少的技巧;
查看本机ip地址;打开百度,输入“ip地址”,可以看到本机的IP地址;
本文使用的是goubanjia.com里面的免费ip;
使用时注意要注意传输协议是http还是https,代码如下;
# 用到的库
import requests
# 写入... 阅读原文
2019-08-06 23:02:03 阅读(2380) 评论(0)
摘要:
有一个难点是遇到了 pandas返回的数据类型,DataFrame() 函数处理才能写入到csv文件里
import pandas as pd
import requests
from bs4 import BeautifulSoup
import csv
url = "http://www... 阅读原文
2019-08-06 22:52:02 阅读(2329) 评论(0)
摘要:
一、for语句:
for 目标 in 表达式:
循环体
1 i = "湖人总冠军"
2 for each in i:
3 print(each)
4 湖
5 人
6 总
7 冠
8 军
9 for each in i:
10 print(e... 阅读原文
2019-08-06 21:26:02 阅读(2378) 评论(0)
摘要:
话不多说,直接上代码;
# 需要的库
import requests
import re
import os
from multiprocessing import Pool
# 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT ... 阅读原文
2019-08-06 20:26:04 阅读(2350) 评论(0)
摘要:
一、通信socket
socket()函数
Python 中,我们用 socket()函数来创建套接字,语法格式如下:
socket.socket([family[, type[, proto]]])
参数
family: 套接字家族可以使AF_UNIX或者AF_INET
type: 套接字类型可以根据... 阅读原文
2019-08-06 19:32:03 阅读(2399) 评论(0)