Python里面有个很棒的语法糖(syntactic sugar),它就是 list comprehension
,有人把它翻译成“列表推导式”,也有人翻译成“列表解析式”。名字听上去很难理解,但是看它的语法就很清晰了。虽然名字叫做 list comprehension,但是这个语法同样适用于dict、set等这一系列可迭代(iterable)数据结构。
语法规范:
out_list = [out_express for out_express in input_list if out_express_condition]
其中的 if
条件判断根据需要可有可无。
下面看一个具体的例子,生成一个包含10以内的偶数的list:
In [1]: evens = [i for i in range(10) if i % 2 == 0] In [2]: evens Out[2]: [0, 2, 4, 6, 8]
由for循环升级到列表推导式:
在没有了解 list comprehension
之前,上面那个生成偶数list的通常做法是用 for
循环:
evens = []for i in range(10): if i % 2 == 0: evens.append(i)
很明显, for
循环占用了4行代码,而 list comprehension
只用了1行代码。
文章开始说到推导式的语法规范时,我们讲了 if
表达式是可有可无的,这也符合我们编程遇到的实际情况。比如,要生成一个10以内的整数的平方的列表:
squares = [i**2 for i in range(10)]
复杂的嵌套循环
我们先来看一个例子,把一个矩阵(以列表为元素的列表)展平为一个列表。首先,我们用 for
循环来实现一下:
matrix = [ [1, 2, 3], [4, 5, 6], [7, 8, 9], ] flattened = []for row in matrix: for i in row: flattened.append(i)
接着我们用列表推导式实现该功能:
flattened = [i for row in matrix for i in row]
还是一行代码就搞定,但一行里面有两个 for
,看起来很乱,两个 for
,哪个在前哪个在后呢? 只要记住他们的顺序和不用推导式的原始for循环是一致的即可。
推导式的可读性
一行代码搞定几行代码的事情,看上去很简洁,但是读起来很费劲,尤其是当条件语句很长的时候,把这一行代码变得很长,超过了代码规范规定的长度(一般是80个字符),也使得理解代码变得困难。
面对一行长长的代码该如何下口读,如何理解呢?别着急,好在Python允许在中括号、花括号之间断行:
列表推导式的断行:
断行前:
evens = [i for i in range(10) if i % 2 == 0]
断行后:
evens = [ i for i in range(10) if i % 2 == 0]
带嵌套循环的推导式的断行:
断行前:
flattened = [i for row in matrix for i in row]
断行后:
flattened = [ i for row in matrix for i in row ]
字典(dict)和集合(set)的推导式:
前面我们也提到过,推导式不仅仅适用于列表,它同样使用于字典dict和集合set。
把一个字典的key和value互换:
changed = {value: key for key, value in input_dict.items()}
用一个列表的所有单词的首字母生成一个集合:
chars = {w[0] for w in words_list}
通过以上讲解就可以轻松掌握Python的列表推导式( list comprehension
)了,简而言之, 就是把普通的多行for循环压缩成一行代码,这种压缩语法适用于列表、字典、集合等可迭代数据结构(iterables)。
在这里跟大家一起分享Python知识,一方面我自已也在写一个 Python教程 的博客: 猿人学 和公从号猿人学Python,从Python基础教程到 Python技术杂谈 ,和一些利用 Python爬虫挣钱的思路 ,都在我的个人博客中首发,兴趣的朋友可以关注一下。