Python的集合

python学习网 2017-12-18 16:04:02

1. Python的集合

1.1 集合的定义

  在Python中, 集合set是基本数据类型的一种集合类型,它有可变集合(set())和不可变集合(frozenset)两种。Python中的集合set类似列表,但每个元素都必须时独一无二的,无序的。

  集合set是无序的、不重复的,是可变的,有add(),remove()等方法。由于集合set是可变的,所以它不存在哈希值。基本功能包括关系测试和消除重复元素。集合对象还支持union(联合)、 intersection(交集)、 difference(差集)和sysmmetric difference(对称差集)等数学运算。

  集合set支持 N in set, len(set),和 for N in set。作为一个无序的集合,集合set不记录元素位置或者插入点。因此,集合set不支持 indexing, 或其它类序列的操作。

  集合frozenset()是冻结的集合,它是不可变的,存在哈希值,优点是它可以作为字典的key,也可以作为其它集合的元素。缺点是一旦创建便不能更改,没有add(),remove()方法。

  因此,Python中集合的作用主要是:去重,把一个列表变成集合,就自动去重;关系测试,测试两组数据之间的交集、差集、并集等关系。

 

1.2 集合的操作

  在Python中,集合set的常用操作包括:创建集合set、集合set增加、集合set删除、集合的交集、集合的并集、集合的差集等。

 

1.2.1 集合的创建

  在Python中,集合的创建可以使用集合的工厂函数set()和frozenset(),但是,set()创建的集合时可变的,frozenset()创建的集合时不可变的,其语法格式分别如下:

  集合名 = set(集合值)

       集合名 = frozenset(集合值)  

  

  (1)创建空集合

  在Python中,当不指定集合的值时,使用工厂函数set()和frozenset()即可创建一个空集合。

  例如,创建空集合。  

  代码:

1 a =set()
2 b = frozenset()
3 print(a)
4 print(b)

  运行结果:

1 set()
2 frozenset()

 

  (2)用set()方法创建集合  

  例如,用set()方法创建一个0到10之间的奇数的集合,并打印出来。

  代码:

1 number_odd = []
2 for number in range(1,11,2):
3     number_odd.append(number)
4 number_opp_set =set(number_odd)
5 print(number_opp_set)

  说明:

  第1行,创建一个空列表。

  第2~3行,用函数range()循环生成0到10之间的奇数,然后增加到空列表中。

  第4行,将列表中的值传给方法set(),生成一个集合。

 

  运行结果:

1 {1, 3, 5, 7, 9}

  以上的代码可以通过列表解析的方式优化为:

  代码1:

1 number_opp_set =set(number for number in range(1,11,2))
2 print(number_opp_set)

  说明:

  因为Python是解释性语言,代码越少,解释花费的时间也少。

 

  运行结果1:

1 {1, 3, 5, 7, 9} 

 

 (3)用frozenset()方法创建集合  

  例如,用frozenset()方法创建一个0到10之间的奇数的集合,并打印出来。

  代码:

1 number_opp_set_0 =frozenset(number for number in range(1,11,2))
2 print(number_opp_set_0)

 

  运行结果:

1 frozenset({1, 3, 5, 7, 9})

 

1.2.2  集合的增加

  在python中,集合的增加有两种常用方法:add()方法和update()方法。

  (1) add()方法

  集合的add()方法是把要传入的元素做为一个整体增加到集合中,即实现单元素增加。

  例如,定义一个0到10的奇数的集合,然后再用add()方法往里面增加一个偶数2和18,然后再打印出来。

  代码:

1 number_opp_set =set(number for number in range(1,11,2))
2 print(number_opp_set)
3 number_opp_set.add(2)
4 number_opp_set.add(18)
5 print(number_opp_set)

  说明:

  第3、4行,都是时使用add()方法分别向集合中增加偶数2和18。

  

  运行结果:

1 {1, 3, 5, 7, 9}
2 {1, 2, 3, 5, 7, 9, 18}

 

  (2)update()方法

  集合update()方法是把要传入的元素拆分,做为单个个体增加到集合中,即多元素增加。

  例如,定义一个0到10的奇数的集合,然后再用update()方法往里面增加一个偶数2和18,然后再打印出来。

  代码:

1 number_opp_set =set(number for number in range(1,11,2))
2 print(number_opp_set)
3 number_opp_set.update('2')
4 number_opp_set.update('18')
5 print(number_opp_set)

  说明:

  第3、4行,分别调用update()方法分别向集团中增加偶数2和18.

 

  运行结果:

1 {1, 3, 5, 7, 9}
2 {1, 3, 5, 7, 9, '2', '8', '1'}

  从以上的运行结果中可知,偶数18倍拆分为1和8分别增加到集合中,并且增加的值都被单引号引起来,这表示增加的是字符窜。这并不是我们需要的结果。

  在Python中,如果调用update()方法向集合中增加两个或多个字符组成的值时,该值需要使用中括号或者花括号括起来,即表示为字典或列表的形式。

  例如,定义一个0到10的奇数的集合,然后再用update()方法往里面增加一个偶数2和18,即奇数19,然后再打印出来。

  代码:

1 number_opp_set =set(number for number in range(1,11,2))
2 print(number_opp_set)
3 number_opp_set.update('2')
4 number_opp_set.update(['18'])
5 number_opp_set.update({'19'})
6 print(number_opp_set)

 

  运行结果:

1 {1, 3, 5, 7, 9}
2 {1, 3, 5, 7, 9, '18', '2', '19'}

 

1.2.3 集合的删除

  在Python中,集合的删除分为两种,一种是删除集合中的值;一种是删除整个集合。

  (1)删除整个集合

  在Python中,当我们需要删除整个集合中时,可使用del 语句直接删除。

  例如,将1.2.2 中创建的集合删除。

  代码:

1 number_opp_set =set(number for number in range(1,11,2))
2 print("集合删除前:",number_opp_set)
3 del  number_opp_set
4 print("集合删除后:",number_opp_set)

  说明:

  第2行,使用del语句删除集合number_opp_set。

 

  运行结果:

1 集合删除前: {1, 3, 5, 7, 9}
2 Traceback (most recent call last):
3   File "F:/PyProject/s14/day2/test_set.py", line 6, in <module>
4     print("集合删除后:",number_opp_set)
5 NameError: name 'number_opp_set' is not defined

  从以上的运行结果可知,使用del语句删除集合时一种永久性的,删除后就集合就不能再被使用。

 

  (2)删除集合中的值

  在Python中,当我们需要删除集合中的值时,可使用remove()方法。

  例如,将1.2.2 中增加到集合中的值删除。

  代码:

 1 number_opp_set =set(number for number in range(1,11,2))
 2 print(number_opp_set)
 3 number_opp_set.update('2')
 4 number_opp_set.update(['18'])
 5 number_opp_set.update({'19'})
 6 print(number_opp_set)
 7 number_opp_set.remove('2')
 8 number_opp_set.remove('18')
 9 number_opp_set.remove('19')
10 print(number_opp_set)

  说明:

  第7、8、9行,分别调用remove()方法分别从集合中删除前面增加到集合中的值,并且remove中的参数必须用引号引起来,否则Python解释器无法解析,会提示错误。

 

  运行结果:

1 {1, 3, 5, 7, 9}
2 {1, 3, 5, 7, '18', 9, '2', '19'}
3 {1, 3, 5, 7, 9}

 

1.2.3 集合的访问

  在Python中,集合的访问主要有两种,一种是访问整个集合,一种的集合的遍历。

  (1)访问整个集合

  在Python中,访问整个集合,可以直接使用。

  例如,创建一个1到10之间的数字组成的偶数的集合,并访问整个集合。

  代码:

1 number_even_set =set(number for number in range(2,11,2))
2 print(number_even_set)

  说明:

  第1行,使用range()函数和for循环,从2开始,依次遍历到10,且步长为2,再用set()方法,将所有遍历过程中满足步长为2的数字创建为一个集合。

  第2行,直接用print打印整个集合。

 

  运行结果:

1 {2, 4, 6, 8, 10}

 

  (2)访问集合中的每个值

  在Python中,我们可以使用for循环来遍历访问集合中的每个值。

  例如,创建一个1到10之间的数字组成的偶数的集合,并遍历访问集合中的每个值。

  代码:

1 number_even_set =set(number for number in range(2,11,2))
2 print(number_even_set)
3 for number_evven in number_even_set:
4     print(number_evven)

 

  运行结果:

1 {2, 4, 6, 8, 10}
2 2
3 4
4 6
5 8
6 10

 

1.3 集合的关系测试

  在Python中,集合的关系测试包括:并集、交集、差集等等。

1.3.1 并集

  集合中,并集也叫合集,即将一个集合和另一个集合合并为一个集合的过程。求并集使用函数union()。

  例如,创建一个1到10之间的数字组成的偶数的集合和奇数集合,然后求其并集。

  代码:

1 number_opp_set =set(number for number in range(1,11,2))
2 print(number_opp_set)
3 number_even_set =set(number for number in range(2,11,2))
4 print(number_even_set)
5 number_set = number_opp_set.union(number_even_set)
6 print(number_set)

  说明:

  第5行,用函数union()将集合number_opp_set和集合number_even_set合并后赋值给变量number_set。

  

  运行结果:

1 {1, 3, 5, 7, 9}
2 {2, 4, 6, 8, 10}
3 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

  从以上的运行结果可知,通过函数union()将两个集合合并为一个集合。

 

1.3.2 交集

  交集就是两个集合中都有的部分,用函数intersection()求两个集合的交集。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其交集。

  代码:

1 number_set_a =set(number for number in range(1,6))
2 print(number_set_a)
3 number_opp_set =set(number for number in range(1,11,2))
4 print(number_opp_set)
5 number_set = number_set_a.intersection(number_opp_set)
6 print(number_set)

  说明:

  第5行,使用函数intersection()求集合number_set_a和集合number_opp_set的交集。

 

  运行结果:

1 {1, 2, 3, 4, 5}
2 {1, 3, 5, 7, 9}
3 {1, 3, 5}

  从以上的运行结果可知,通过函数intersection()已经把两个集合的公共部分求出来了。

 

1.3.3 差集

  差集就是在两个集合中,在集合a中有,但集合b中没有的部分,或者集合b中有,但集合a中没有的部分。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其差集。

  代码:

1 number_set_a =set(number for number in range(1,6))
2 print(number_set_a)
3 number_opp_set =set(number for number in range(1,11,2))
4 print(number_opp_set)
5 number_set = number_set_a.difference(number_opp_set)
6 print(number_set)
7 _number_set = number_opp_set.difference(number_set_a)
8 print(_number_set)

  说明:

  第5行,使用函数difference()求集合number_set_a中有,但集合number_opp_set中没有的部分,并赋值给变量number_set。

  第7行,使用函数difference()求集合number_opp_set中有,但集合number_set_a中没有的部分,并赋值给变量_number_set。

 

  运行结果:

1 {1, 2, 3, 4, 5}
2 {1, 3, 5, 7, 9}
3 {2, 4}
4 {9, 7}

 

1.3.4 子集

  判断集合a是否是集合b的子集,使用函数issubset()。

  例如,创建一个1到10的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其子集。

  代码:

1 number_set_a =set(number for number in range(1,11))
2 print(number_set_a)
3 number_opp_set =set(number for number in range(1,11,2))
4 print(number_opp_set)
5 number_set = number_set_a.issubset(number_opp_set)
6 print(number_set)
7 _number_set = number_opp_set.issubset(number_set_a)
8 print(_number_set)

  说明:

  第5行,判断集合number_set_a是否是集合number_opp_set的子集,判断结果赋值给变量number_set。

  第7行,判断集合number_opp_set是否是集合number_set_a的子集,判断结果赋值给变量_number_set。

 

  运行结果:

1 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
2 {1, 3, 5, 7, 9}
3 False
4 True

 

1.3.5 父集

  判断集合a是否是集合b的父集,使用函数issuperset()。

  例如,创建一个1到10的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其父集。

  代码:

1 number_set_a =set(number for number in range(1,11))
2 print(number_set_a)
3 number_opp_set =set(number for number in range(1,11,2))
4 print(number_opp_set)
5 number_set = number_set_a.issuperset(number_opp_set)
6 print(number_set)
7 _number_set = number_opp_set.issuperset(number_set_a)
8 print(_number_set)

  说明:

  第5行,判断集合number_set_a是否是集合number_opp_set的父集,判断结果赋值给变量number_set。

  第7行,判断集合number_opp_set是否是集合number_set_a的父集,判断结果赋值给变量_number_set。

 

  运行结果:

1 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
2 {1, 3, 5, 7, 9}
3 True
4 False

 

1.3.5 对称差集

  对称差集就是求两个集合中的剔除公共的部分的集合。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其对称差集。

  代码:

1 number_set_a =set(number for number in range(1,6))
2 print(number_set_a)
3 number_opp_set =set(number for number in range(1,11,2))
4 print(number_opp_set)
5 number_set = number_set_a.symmetric_difference(number_opp_set)
6 print(number_set)
7 _number_set = number_opp_set.symmetric_difference(number_set_a)
8 print(_number_set)

  说明:

  

  第5行,使用函数symmetric_difference()求集合number_set_a和集合number_opp_set的对称差集,并赋值给变量number_set。

  第7行,使用函数symmetric_difference()求集合number_opp_set和集合number_set_a的对称差集,并赋值给变量_number_set。

  

  运行结果:

1 {1, 2, 3, 4, 5}
2 {1, 3, 5, 7, 9}
3 {2, 4, 7, 9}
4 {2, 4, 7, 9}

  从以上的运行结果可知,求两个集合的对称差集时,哪个集合写在函数中都行,其结果都一样。

 

阅读(744) 评论(0)