Python新手在这里,我已经阅读了
Filter rows of a numpy array?和doc但仍然无法弄清楚如何以python方式编写代码.
我有的示例数组:(实际数据是50000 x 10)
a = numpy.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = ['a','c']
我需要在过滤器中找到a中带有[:,1]的所有行.预期结果:
[[2,'a'],[4,'c']]
我目前的代码是这样的:
numpy.asarray([x for x in a if x[1] in filter ])
它工作正常,但我在某处读到它效率不高.什么是适当的numpy方法?
编辑:
谢谢你所有正确的答案!不幸的是,我只能将一个标记为已接受的答案我很惊讶numpy.in1d没有出现在谷歌搜索numpy过滤器2d数组.
最佳答案 您可以使用可以使用
np.in1d
生成的bool索引数组.
您可以沿着您想要使用的任何axis
索引np.ndarray,例如指示是否应包含元素的bool数组.由于你想沿轴= 0索引,这意味着你想从outest索引中选择,你需要有1D np.array,其长度是行数.其每个元素都将指示是否应包含该行.
一个快速的方法是在a的第二列使用np.in1d
.您可以通过[:,1]获得该列的所有元素.现在你有一个np.array,其元素应该根据你的过滤器进行检查.这就是np.in1d
的用途.
所以完整的代码看起来像:
import numpy as np
a = np.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = np.asarray(['a','c'])
a[np.in1d(a[:, 1], filter)]
或以更长的形式:
import numpy as np
a = np.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = np.asarray(['a','c'])
mask = np.in1d(a[:, 1], filter)
a[mask]