python – 有效地改变scipy.spare.csr_matrix的维度[复制]

参见英文答案 >
Adding a column of zeroes to a csr_matrix                                    2个

我有一个函数,它采用csr_matrix并对其进行一些计算.

这些计算的行为要求该矩阵的形状是特定的(比如NxM).

我发送的输入具有较少的列和确切的行数.

(例如,它具有形状=(A,B),其中A< N和B == M) 例如:我有对象x

>>>x = csr_matrix([[1,2],[1,2]])
>>>x
(0, 0)  1
(0, 1)  2
(1, 0)  1
(1, 1)  2
>>>x.shape
(2, 2)

和函数f:

def f(csr_mat):
    """csr_mat.shape should be (2,3)"""

然后我想在x上做一些事情,所以它会变成y:

>>>y = csr_matrix([[1,2,0],[1,2,0]])
>>>y
(0, 0)  1
(0, 1)  2
(1, 0)  1
(1, 1)  2
>>>y.shape
(2, 3)

在此示例中,x和y具有相同的非零值,但y具有不同的形状.我想要的是有效地’扩展’x到一个新的维度,用零填充新的列.即,给定x和new_shape =(2,3),它应该返回y.
我已经尝试过重塑:

x.reshape((2,3))

但后来我得到了:

NotImplementedError

我的第二个选择是创建具有不同形状的新csr_matrix:

z = csr_matrix(x,shape=(3,3))

但这也失败了:

NotImplementedError: Reshaping not implemented for csr_matrix.

编辑:使用csc_matrix带来了同样的错误.

有任何想法吗?

谢谢

最佳答案 在CSR格式中,所需y的基础数据,索引和indptr数组与x矩阵的基础数据,索引和indptr数组相同.您可以使用新形状将它们传递给csr_matrix构造函数:

y = csr_matrix((x.data, x.indices, x.indptr), shape=(2, 3))

请注意,构造函数默认为copy = False,因此这将共享x和y之间的数据,索引和indptr. y上的一些操作将反映在x中.您可以传递copy = True以使x和y彼此独立.

如果你想查看csr_matrix的未记录的内部,你可以设置内部_shape属性,使x数组具有你想要的形状:

x._shape = (2, 3)

这样做并没有什么优势.

点赞