集合set

去重的,可变的,可迭代的,无序的 元素集合

set的元素必须是可hash的

约定

set翻译为集合

collection 翻译为集合类型,是一个大概念

set定义 初始化

set() -> new empty set object

set(iterable) -> new set object

s1=set()#空sets2=set(range(5))s3=set(list(range(10)))s4={}#空{}是空字典(dict)不是空sets5={9,10,11}#sets6={(1,2),3,'a'}s7={[1],(1,),1}#报错:[1]是unhashabletype:'list'

set的元素

set 的元素要求必须是可hash的

目前学过的不可hash的类型有list,set,bytearray

元素不可以索引

set 可以迭代

set增加

add(elem) -> None

增加一个元素到set中

如果元素存在,什么都不做(set的去重性质)

update( * others) -> None

合并其他元素到set集合中来

参数others必须是可迭代对象,可以是多个用逗号隔开

就地修改

set删除

remove(elem) -> None

从set中移除一个元素

元素不存在,抛出keyError异常

discard(elem) -> None

从set中移除一个元素

元素不存在什么都不做

pop() -> item

移除并返回任意的元素.(类似随机的)

空集合返回keyError异常

clear()

移除所有元素

set 修改,查询

修改:

要么删除,要么加入新的元素

查询:

非线性结构,无法索引

遍历:

可以迭代所有元素

成员运算符

in 和 not in 判断元素是否在set中

效率为 O(1) ### list,tuple等用成员运算符时,效率为O(n)

set 和线性结构

线性结构的查询时间复杂度是O(n),随着数据规模的增大而增加耗时

set,dict等结构,内部使用hash值作为Key,时间复杂度可以做到O(1),查询时间和数据规模无关

可hash

数值型int,float,complex

布尔型 True,False

字符串 string,bytes

tuple

None

以上都是不可变类型,称为可哈希类型,hashable


集合

基本概念

全集:所有元素的集合.例如实数集,所有实数组成的集合就是全集

子集subset和超集superset:一个集合A所有的元素都在另一个集合B内,A是B的子集,B是A的超集

真子集和真超集:A是B的子集,且A不等于B,A就是B的真子集,B是A的真超集

并集:多个集合合并的解构

交集:多个集合的公共部分

差集:集合中除去和其他集合公共部分


集合运算

并集

将两个集合A和B的所有的元素合并到一起,组成的集合称作集合A与集合B的并集

set.union(*others)

返回和多个集合合并后的新的集合

| 运算符重载

等同union

set.update(*others) -> None

和多个集合合并,就地修改

|= -> None

等同update

交集

集合A和B,由所有属于A且属于B的元素组成的集合

set.intersection(* others)

返回和多个集合的交集

&

等同intersection

set.intersection_update(*others) -> None

获取和多个集合的交集,并就地修改

&= -> None

等同intersection_update

差集

集合A和B,由所有属于A且不属于B的元素组成的集合

set.differentce(*others)

返回和多个集合的差集

-

等同difference

set.difference_update(*others)

获取和多个合集的差集并就地修改

-=

等同difference_update(*others)

对称差集

集合A和B,由所有不属于A和B的交集元素组成的集合,基座(A-B)U(B-A)

symmetric_difference(other)

返回和另一个集合的差集

^

等同symmetric_difference(other)

symmetric_difference_update(other)

获取和另一个集合的差集并就地修改

^=

等同symmetric_difference_update

集合判断

set.issubset(other), <=

判断当前集合是否是other的子集

set1 < set2

判断set1 是否是set2 的真子集

set.issuperset(other) >=

判断当前集合是否是other的超集

set1 > set2

判断set1 是否是 set2 的真超集

set.isdisjoint(other)

当前集合和另一个集合没有交集

没有交集,返回True