在python中,据我所知,至少有3到4种方法来创建和初始化给定大小的列表:
简单循环append
:
my_list = [] for i in range(50): my_list.append(0)
简单循环+=
:
my_list = [] for i in range(50): my_list += [0]
列表理解:
my_list = [0 for i in range(50)]
列表和整数乘法:
my_list = [0] * 50
在这些例子中,我认为只有列表只有50个元素会有任何性能差异,但如果我需要一个包含一百万个元素的列表呢?使用xrange
会有什么改进吗?哪个是在python中创建和初始化列表的首选/最快方法?
解决方案
让我们运行一些时间测试* timeit.timeit
:
>>> from timeit import timeit >>> >>> # Test 1 >>> test = """ ... my_list = [] ... for i in xrange(50): ... my_list.append(0) ... """ >>> timeit(test) 22.384258893239178 >>> >>> # Test 2 >>> test = """ ... my_list = [] ... for i in xrange(50): ... my_list += [0] ... """ >>> timeit(test) 34.494779364416445 >>> >>> # Test 3 >>> test = "my_list = [0 for i in xrange(50)]" >>> timeit(test) 9.490926919482774 >>> >>> # Test 4 >>> test = "my_list = [0] * 50" >>> timeit(test) 1.5340533503559755 >>>
如您所见,最后一种方法是迄今为止最快的方法。
但是,它应该只用一成不变的物品(如整数)使用。这是因为它将创建一个列表,其中包含对同一项的引用。
以下是演示:
>>> lst = [[]] * 3 >>> lst [[], [], []] >>> # The ids of the items in `lst` are the same >>> id(lst[0]) 28734408 >>> id(lst[1]) 28734408 >>> id(lst[2]) 28734408 >>>
这种行为通常是不受欢迎的,并且可能导致代码中的错误。
如果你有可变项(例如列表),那么你应该使用仍然非常快的列表理解:
>>> lst = [[] for _ in xrange(3)] >>> lst [[], [], []] >>> # The ids of the items in `lst` are different >>> id(lst[0]) 28796688 >>> id(lst[1]) 28796648 >>> id(lst[2]) 28736168 >>>
*注意:在所有测试中,我替换range
为xrange
。由于后者返回迭代器,因此它应该总是比前者快。
本文首发于Python黑洞网,博客园同步更新