分类
摘要:
一、集合定义及其功能
集合是一个无序的、不重复的数据组合,和字典列表一样也是一种数据类型。
集合两个最主要的功能:①去重(把一个列表变成集合,就自动去重了)
②关系测试(测试两组数据之间的交、并、差集等关系)
二、关系测试
首先,如何创建集合?
两种方式:(1)直接创建
a=set([1,8,2,3,5,4,5,3... 阅读原文
2018-04-11 12:26:04 阅读(743) 评论(0)
摘要:
html = r'{"code":404,"msg":"\u8be5\u8d44\u6e90\u4e0d\u5b58\u5728"}'
print(html)# {"code":404,"msg":"\u8be5\u8d44\u6e90\u4e0d\u5b58\u5728"}
print(html.encode('... 阅读原文
2018-04-11 10:59:03 阅读(769) 评论(0)
摘要:
一、hashlib模块
1、什么叫hash:hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法),该算法接受传入的内容,经过运算得到一串hash值
2、hash值的特点是:
2.1 只要传入... 阅读原文
2018-04-11 10:38:02 阅读(799) 评论(0)
摘要:
KNN基本步骤:计算与已知数据的距离,选择k个最近距离的数据,看这k个数据的标签最多属于什么类,预测未知数据的分类
1、新建一个KNN.py模块
需要使用numpy
from numpy import *
import operator
2. 向模块添加已知的数据和标签
def createDataSet():... 阅读原文
2018-04-11 09:44:01 阅读(755) 评论(0)
摘要:
1、str对象的join()函数
语法:'sep'.join(seq)
参数说明
sep:分隔符。可以为空
seq:要连接的元素:序列、字符串、元组、字典
例子:
li = ["11", "22", "33"]
ret = "-".join(li)
print(ret) #输出 11-22-33
2、os.pat... 阅读原文
2018-04-11 09:39:01 阅读(738) 评论(0)
摘要:
前端时间遇到一个通过url下载文件的需求,只需要简单的编写一个py脚本即可。从网上搜了下python实现文件下载的方法,总结如下,备查。
以下方法均已测试,环境win8.1 python2.6/2.7
方法一:
使用 urllib 模块提供的 urlretrieve() 函数。urlretrieve() 方法直... 阅读原文
2018-04-11 09:34:01 阅读(813) 评论(0)
摘要:
(一) 说明
在上一篇的基础上修改了下,使用lxml提取博客园随笔正文内容,并保存到Word文档中。
操作Word文档会用到下面的模块:
pip install python-docx
修改的代码(主要是在link_crawler()的while循环中增加了下面这段)
1 tree = lxm... 阅读原文
2018-04-11 08:17:03 阅读(763) 评论(0)
摘要:
第一部分:线性可分
通俗解释:可以用一条直线将两类分隔开来
一个简单的例子,直角坐标系中有三个点,A,B点为0类,C点为1类:
from sklearn import svm
# 三个点
x = [[1, 1], [2, 0], [2, 3]]
# 三个点所属类
y = [0, 0, 1]
clf = svm.... 阅读原文
2018-04-11 07:52:12 阅读(714) 评论(0)
摘要:
virtualenv 的安装及使用
由于 Python 模块的每个版本的接口与功能可能存在某些的差异,所以可能导致同一个 Python 应用不能在多个的 Python 环境下运行。Virtualenv 是 Python 的第三方模块,可以通过 Virtualenv 在同一平台上创建多个虚拟环境,在不同的虚拟环境下安装... 阅读原文
2018-04-11 06:57:01 阅读(763) 评论(0)
摘要:
python逻辑判断 () not and or
优先级关系:()>not>and>or
运算符示意
not –表示取反运算。
and –表示取与运算。
or –表示取或运算。
or 是逻辑或,其值为:a ,b至少一个为True,则a or b为Trueand 是逻辑与,其值为:a,b 只要有一... 阅读原文
2018-04-11 06:00:05 阅读(766) 评论(0)