python numpy过滤二维数组的条件

Python新手在这里,我已经阅读了
Filter rows of a numpy array?和doc但仍然无法弄清楚如何以python方式编写代码.

我有的示例数组:(实际数据是50000 x 10)

a = numpy.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = ['a','c']

我需要在过滤器中找到a中带有[:,1]的所有行.预期结果:

[[2,'a'],[4,'c']]

我目前的代码是这样的:

numpy.asarray([x for x in a if x[1] in filter ])

它工作正常,但我在某处读到它效率不高.什么是适当的numpy方法?

编辑:

谢谢你所有正确的答案!不幸的是,我只能将一个标记为已接受的答案我很惊讶numpy.in1d没有出现在谷歌搜索numpy过滤器2d数组.

最佳答案 您可以使用可以使用
np.in1d生成的bool索引数组.

您可以沿着您想要使用的任何axis索引np.ndarray,例如指示是否应包含元素的bool数组.由于你想沿轴= 0索引,这意味着你想从outest索引中选择,你需要有1D np.array,其长度是行数.其每个元素都将指示是否应包含该行.

一个快速的方法是在a的第二列使用np.in1d.您可以通过[:,1]获得该列的所有元素.现在你有一个np.array,其元素应该根据你的过滤器进行检查.这就是np.in1d的用途.

所以完整的代码看起来像:

import numpy as np

a = np.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = np.asarray(['a','c'])
a[np.in1d(a[:, 1], filter)]

或以更长的形式:

import numpy as np

a = np.asarray([[2,'a'],[3,'b'],[4,'c'],[5,'d']])
filter = np.asarray(['a','c'])
mask = np.in1d(a[:, 1], filter)
a[mask]
点赞