python为何这么简洁方便
python非常的简洁,如果用C语言100行才能干的事儿,python只需要10行、5行甚至一行。很重要的一个原因就是python支持的这些高级数据结构,节省了很多代码量。
List
列表是python中最常用的数据类型。list是有序的集合,可以随时添加删除元素
[item1,item2 ...]
语法上是 []
中的元素组成的有序集合,元素不必是同一类型,List中可以有List元素。
>>>language=['c','java','python']
>>>language
['c','java','python']
和 字符串 一样,List同样可以被索引和切片,List也是可迭代对象,不同的是List是可变数据类型。
常用API
-
list(obj)
将对象强制转成list,比如list(range(5))
-
list.append(obj)
在列表尾追加obj
-
list.insert(index,obj)
index索引处插入obj
-
list.pop(obj=list[-1])
移除列表中的元素(默认最后一个) -
list.remove(obj)
移除obj匹配的第一个对象
>>>s=[1,2,3,4,5,[6,7,8],9]
>>>s.append(0)
[1, 2, 3, 4, 5, [6, 7, 8], 9, 0]
>>>s.insert(-1,-1)
[1, 2, 3, 4, 5, [6, 7, 8], 9, -1, 0]
>>>s.pop(-5)
[1, 2, 3, 4, 5, 9,-1, 0]
>>>s.sort()
[-1, 0, 1, 2, 3, 4, 5, 5, 9]
>>>s.reverse()
[9, 5, 5, 4, 3, 2, 1, 0, -1]
>>>s.count(5)
2
利用python为list提供的这些API,我们可以很轻松实现栈和队列这两个数据结构,当然是在你不考虑插入查找操作的复杂度基础上。python的 collections [1] 这个库中的队列是更好的选择。
>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry") # Terry arrives
>>> queue.append("Graham") # Graham arrives
>>> queue.popleft() # The first to arrive now leaves
'Eric'
>>> queue.popleft() # The second to arrive now leaves
'John'
>>> queue # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])
List的生成
1.直接定义
直接用[item1,item2, ...]
穷举法来构造处List
2.迭代
在Python中,迭代是通过for ... in
来完成的,而很多语言比如C或者Java,迭代list是通过下标索引完成的。python的抽象程度更高,对于 dict{key:value}
可以用 for key in dict
来进行迭代另一方面,python的迭代更加的通用,它适用于所有可迭代对象。可以用下面方法判断是否为可迭代对象
>>> from collections import Iterable
>>> isinstance(List, Iterable)
True
生成一个List很简单,结合之前的API和 for
关键字
>>> squares = []
>>> for x in range(10):
... squares.append(x**2)
...
>>> squares
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
当然对于python而言,这种写法已经算是复杂了,之后会接触很多实用的python高级函数。
3.列表生成式
上面的迭代写法,如果用列表生成式来写,那就是
squares = [x**2 for x range(10)]
python的语义已经非常清楚了,多写几次就能很快熟悉了。
列表生成式很大程度的体现了python的简洁高效的特点,还可以在表达式中添加过滤条件,处理函数等等。
>>> vec = [-4, -2, 0, 2, 4]
>>> [x*2 for x in vec]
[-8, -4, 0, 4, 8]
>>> [x for x in vec if x >= 0]
[0, 2, 4]
>>> [abs(x) for x in vec]
[4, 2, 0, 2, 4]
稍微复杂一些的用法
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']
>>> [(x, x**2) for x in range(6)]
[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]
>>> vec = [[1,2,3], [4,5,6], [7,8,9]]
>>> [num for elem in vec for num in elem]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
Tuple
元组是不可变对象,初始化之后就不可更改。所以,tuple 没有list中append() insert()这样的操作函数,tuple中的元素不可修改。在代码中,tuple带来的好处很多,要大胆的使用它。构造语句:
>>> t=(1,2,3,4,5)
tuple的概念有一点很绕,tuple对象不可变,但是tuple可以包含list这种可变的对象。
>>> t = 12345, 54321, 'hello!'
>>> t[0] = 1
...会提示修改失败
>>> t = ([1,2,3],4,5)
>>> t[0][2] = 4
>>> t
t = ([1,2,4],4,5)
上面的例子,t这个tuple本身并没有变,只是其中的第一个元素内容变了。因为t[0]指向了list类型的可变对象。理解这一点,tuple就很简单了。
Set
set可以看成是无重复,无序key的集合,它和数学中的集合一样,两个set之间可以进行交并的操作。
使用 set()
或者 { }
来创建,经常用于重复测试或者关系测试。
重复插入虽然不犯错,但不实际存储。
>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket) # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
>>> a - b # letters in a but not in b
{'r', 'd', 'b'}
>>> a | b # letters in either a or b
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b # letters in both a and b
{'a', 'c'}
>>> a ^ b # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}
Dict
python内置了dict,也就是以 key:value
的形式存储数据,具有极快的查找速度
- dict在内部通过 hash 直接计算处
key
对用的value
的地址,所以查找很快 -
key
的值不可变,所以不能用List来作为key
- dict占用大量内存,这是肯定的,以空间换时间了
- 同一个字典不能有重复的key,新的会覆盖旧的
对一个字典执行 list(d.keys())
将返回一个字典中所有关键字组成的无序列表(如果你想要排序,只需使用 sorted(d.keys()) )
。使用 in 关键字可以检查字典中是否存在某个关键字(指字典)
>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False
>>> d = {} #initialize
>>> dict(sape=4139, guido=4127, jack=4098) #可以直接利用关键字参数传入
{'sape': 4139, 'jack': 4098, 'guido': 4127}
TIPs
利用
del
语句来批量删除List 中的元素元组只有一个元素时的定义
t=(0)
会有歧义,与t=0
作用相同,所以用t=(0,)
来消除冲突。dict和set也有与列表生成式相似的生成式
>>> {x: x**2 for x in (2, 4, 6)} {2: 4, 4: 16, 6: 36} >>> {x for x in 'abracadabra' if x not in 'abc'} {'r', 'd'}
collections是Python内建的一个集合模块,提供了许多有用的集合类。 ↩