python – 有没有办法在使用operator.itemgetter()作为排序键时强制转换值?

我有一个包含字符串代表数字的列表列表:

nums = [['1','3'],['2','2'],['1','2'],['0','2'],['11','2']]

我需要通过第一个和第二个条目对这些数字进行排序,而不修改原始列表中数字的字符串表示.此外,想要避免创建另一个列表的第二个副本,其中所有内容都明确映射到整数 – 想象这是一个巨大的列表.

sort()和sorted()都可以很好地处理元组和列表,所以使用lambda键,我可以执行以下操作:

>>> sorted(nums, key=lambda n: (int(n[0]),int(n[1])) 
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]

快乐的时光…

但是,我已经看到一些关于使用operator.itemgetter()作为使用lambda的关键函数进行排序更快的帖子.在没有讨论这些声明的有效性的情况下,如果有可能在使用operator.itemgetter()时应用从字符串转换为整数进行比较的任何人:

由于字符串被比较为字符串而不是数字,以下显然会失败:

>>> sorted(nums, key=operator.itemgetter(0,1)) 
[['0', '2'], ['1', '2'], ['1', '3'], ['11', '2'], ['2', '2']]

最佳答案 有方法,例如使用
iteration_utilities.chained 1和
functools.partial

>>> import operator import itemgetter
>>> from iteration_utilities import chained
>>> from functools import partial

>>> itemgetter_int = chained(operator.itemgetter(0, 1), partial(map, int), tuple)
>>> sorted(nums, key=itemgetter_int)
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]

它可以工作,但它比使用lambda或自定义函数要慢得多.

如果你真的需要速度,你可以对lambda函数进行cython化(或者用C语言编写),但是如果你只需要在一个地方使用它就可以使用丢弃的lambda.特别是如果它处于排序状态,因为它具有O(nlog(n))比较,因此O(n)函数调用可能对总体执行时间没有太大贡献.

1:这是我创作的3rd party extension module中的一个功能.它需要单独安装,例如通过conda或pip.

点赞