分类
摘要:
作为开发人员,你一定明白大数据时代,数据变得有多么重要。对于很多企业来说,数据是其生存的根基,所以对数据的保护越来越得到重视。
如何保护自家数据?如何爬取别人家的数据?成为各家数据工程师的矛和盾,也让爬虫与反爬虫技术这几年飞速发展。
我看到很多有 Python 基础的人,都会选择先学个爬虫,让自己辛苦所学,得... 阅读原文
2020-02-29 20:52:07 阅读(2363) 评论(0)
摘要:
什么是CSRF
浏览器在发送请求的时候,会自动带上当前域名对应的cookie内容,发送给服务端,不管这个请求是来源A网站还是其它网站,只要请求的是A网站的链接,就会带上A网站的cookie。浏览器的同源策略并不能阻止CSRF攻击,因为浏览器不会停止js发送请求到服务端,只是在必要的时候拦截了响应的内容。或者说... 阅读原文
2020-02-29 19:15:03 阅读(2410) 评论(0)
摘要:
1. operator内置操作符的函数接口
使用迭代器编程时,有时需要为简单的表达式创建小函数。有些情况下,尽管这确实可以被实现为lambda函数,但某些操作根本不需要新函数。operator模块定义了一些函数,可以对应标准对象API中内置的算术、比较和其他操作。
1.1 逻辑操作
有些函数可以用来确定一个值... 阅读原文
2020-02-29 17:40:05 阅读(2456) 评论(0)
摘要:
python3-cookbook中每个小节以问题、解决方案和讨论三个部分探讨了Python3在某类问题中的最优解决方式,或者说是探讨Python3本身的数据结构、函数、类等特性在某类问题上如何更好地使用。这本书对于加深Python3的理解和提升Python编程能力的都有显著帮助,特别是对怎么提高Python程... 阅读原文
2020-02-29 16:20:01 阅读(2843) 评论(0)
摘要:
python3-cookbook中每个小节以问题、解决方案和讨论三个部分探讨了Python3在某类问题中的最优解决方式,或者说是探讨Python3本身的数据结构、函数、类等特性在某类问题上如何更好地使用。这本书对于加深Python3的理解和提升Python编程能力的都有显著帮助,特别是对怎么提高Python程... 阅读原文
2020-02-29 15:50:01 阅读(2381) 评论(0)
摘要:
Python 有两种错误很容易辨认:语法错误和异常(本文将重点介绍python的异常)。
python语法错误:
Python 的语法错误或者称之为解析错,是初学者经常碰到的;
>>>while True print('Hello world')
File "<stdin&g... 阅读原文
2020-02-29 15:27:01 阅读(2887) 评论(0)
摘要:
在pandas中怎么样实现类似mysql查找语句的功能:
select * from table where column_name = some_value;
pandas中获取数据的有以下几种方法:
布尔索引
位置索引
标签索引
使用API
假设数据如下:
import pandas as pd
im... 阅读原文
2020-02-29 13:44:03 阅读(2318) 评论(0)
摘要:
循环作为程序中经常用到的控制结构,在python中常以for循环形式出现;就像下面一样:
这样显得有些累赘,有没有更简洁的循环遍历的方法,当然有!
enumerate
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标;一般用于for循环... 阅读原文
2020-02-29 12:13:03 阅读(2377) 评论(0)
摘要:
Pycharm 大型Python项目首选
相对与Sublime Text, Pycharm功能更加丰富。
主要表现在:
支持自动代码联想
更专注于Python代码编程
支持自动报错及报错提示等
支持代码跳转等。
.......功能多多,需要自己去探索。
碰到问题解决问题
Pycharm工具如果不会... 阅读原文
2020-02-29 10:46:04 阅读(3527) 评论(0)
摘要:
降维
PCA算法及其应用
主成分分析(PCA),通常用于高维数据的探索与可视化。可以拔具有相关性的高维变量转化为线性无关的低维变量。称为主成分,能够尽可能保存原始数据的信息。
几个概念
方差:样本与样本均值的差的平方和的均值,用来度量一组数据的分散程度。
协方差:用于度量两个变量的线性相关程度。
特征向量:描... 阅读原文
2020-02-29 09:29:03 阅读(2429) 评论(0)