python – 连接/附加不同大小的多个垂直数组

2023年5月15日 227次阅读

我有一个函数返回一个numpy数组.我用不同的数据文件循环这个函数,但最终会得到每个循环给出一个不同大小的数组(这是所需的输出),但我无法弄清楚如何正确地追加这些数组.示例数组和我从文件中获取数据后用于排列它们的方法如下所示：

a1 = np.array([1,2,3]) 
a2 = np.vstack(a1)
# array([[1],
   [2],
   [3]])
b1 = np.array([4,5,6,7])
b2 = np.vstack(b2)
# array([[4],
   [5],
   [6],
   [7]])

简单地说,我有这两个数组,其中一个有3个元素,另一个有4个.我想垂直排列它们看起来像这样导出它：

我不希望零或Na填补数据中的空白,因为这会使更多的工作.

这需要适用于列宽为2的垂直数组,以便像这样组织输出数据：

1  2   5  6   10  11
2  3   6  7   11  12
3  4   7  8   12  13
       8  9

所以第一个循环会生成这个垂直的3,2数组,而循环的第二个迭代会生成4,2数组,我想要将4,2数组追加或连接到原始的3,2数组,依此类推.这些数组集的宽度始终为2,但长度将从每组2变化.

我已经尝试使用基本的np.column_stack,np.concatenate和np.append函数,但它们没有用.这些可以是列表而不是numpy数组,如果它更好地工作或甚至在数据帧中组织输出的数据就可以了.

=======更新=======

更具体一点,在尝试了这里提供的一些解决方案之后,我的问题还有一些细节.
我的函数从数据文件中获取数据(工作正常),它返回2个列表或数组(也就是说)具有相同维度的值(这里也没有问题).

现在我试图在循环遍历目录中的所有文件时执行此操作,并且我想为每个文件追加/连接这两个列表(或数组),但它们可以是不同的大小.当我尝试将它们垂直放在一起以产生输出数据列时,会出现问题.此外,我需要对循环中的值进行简单的数学运算,因此我认为它们可能需要是numpy数组(或类似的东西),而不是列表.

循环#1返回：

outdata1 = [0.0012,0.0013,0.00124,0.00127]
outdata2 = [0.0016,0.0014,0.00134,0.0013]

循环#2返回：

outdata1 = [0.00155,0.00174,0.0018]
outdata2 = [0.0019,0.0020,0.0021]

等等…

现在我需要对这些进行数学运算并将它们吐出到垂直组织的列数据中而不会切断任何数据.这可以通过将Na放入空间或使用数据框来完成,如果可行的话,我可以在导出之前纠正这些空格.我希望它看起来像这样：

0.0012 0.0016 0.00155 0.0019
0.0013 0.0014 0.00174 0.0020
0.00124 0.00134 0.0018 0.0021
0.00127 0.0013

最佳答案首先,数组上的vstack将数组视为第一维上的列表.然后它将每个’row / element’变成一个二维数组,并将它们连接起来.

这些都做同样的事情：

In [94]: np.vstack(np.array([1,2,3]))                                           
Out[94]: 
array([[1],
       [2],
       [3]])
In [95]: np.vstack([[1],[2],[3]])                                               
Out[95]: 
array([[1],
       [2],
       [3]])
In [96]: np.concatenate(([[1]],[[2]],[[3]]), axis=0)                            
Out[96]: 
array([[1],
       [2],
       [3]])

匹配数组或列表可以是’column_stack` – 数组转换为(n,1)数组,然后在第二维上连接：

In [97]: np.column_stack(([1,2,3], [4,5,6]))                                    
Out[97]: 
array([[1, 4],
       [2, 5],
       [3, 6]])

但衣衫褴褛的阵列不起作用.

不同大小的列表/数组数组具有对象dtype,并且出于许多目的,如列表列表：

In [98]: np.array(([1,2,3],[4,5,6,7]))                                          
Out[98]: array([list([1, 2, 3]), list([4, 5, 6, 7])], dtype=object)

您的上一个结构可以写成一个粗糙的列表列表：

In [100]: [[1,2,5,6,10,11],[2,3,6,7,11,12],[3,4,7,8,12,13],[8,9]]               
Out[100]: [[1, 2, 5, 6, 10, 11], [2, 3, 6, 7, 11, 12], [3, 4, 7, 8, 12, 13], [8, 9]]
In [101]: np.array(_)                                                           
Out[101]: 
array([list([1, 2, 5, 6, 10, 11]), list([2, 3, 6, 7, 11, 12]),
       list([3, 4, 7, 8, 12, 13]), list([8, 9])], dtype=object)

请注意,虽然这并没有将[8,9]与其他人排成一行.你需要某种填料/垫片. Python列表zip_longest提供：

In [102]: from itertools import zip_longest                                     
In [103]: alist = [[1,2,3],[2,3,4],[5,6,7,8],[11,12,13]]                        
In [104]: list(zip_longest(*alist))                                             
Out[104]: [(1, 2, 5, 11), (2, 3, 6, 12), (3, 4, 7, 13), (None, None, 8, None)]

使用这个填充,我们可以创建一个2d数组(因为None,对象dtype)：

In [105]: np.array(_)                                                           
Out[105]: 
array([[1, 2, 5, 11],
       [2, 3, 6, 12],
       [3, 4, 7, 13],
       [None, None, 8, None]], dtype=object)

===

我可以使用一点功能在上一个显示中生成数字：

In [232]: def foo(i,n): 
     ...:     return np.column_stack((np.arange(i,i+n), np.arange(i+1,i+1+n))) 
     ...:                                                                       
In [233]: foo(1,3)                                                              
Out[233]: 
array([[1, 2],
       [2, 3],
       [3, 4]])
In [234]: foo(5,4)                                                              
Out[234]: 
array([[5, 6],
       [6, 7],
       [7, 8],
       [8, 9]])
In [235]: foo(10,3)                                                             
Out[235]: 
array([[10, 11],
       [11, 12],
       [12, 13]])

我可以把所有这些数组放在一个列表中：

In [236]: [Out[233], Out[234], Out[235]]                                        
Out[236]: 
[array([[1, 2],
        [2, 3],
        [3, 4]]), array([[5, 6],
        [6, 7],
        [7, 8],
        [8, 9]]), array([[10, 11],
        [11, 12],
        [12, 13]])]

我可以将该列表转换为对象dtype数组：

In [237]: np.array([Out[233], Out[234], Out[235]])                              
Out[237]: 
array([array([[1, 2],
       [2, 3],
       [3, 4]]),
       array([[5, 6],
       [6, 7],
       [7, 8],
       [8, 9]]),
       array([[10, 11],
       [11, 12],
       [12, 13]])], dtype=object)

我还可以用以下方法显示这些数组的几行：

In [238]: for i in range(3): 
     ...:     print(np.hstack([a[i,:] for a in Out[236]])) 
     ...:                                                                       
[ 1  2  5  6 10 11]
[ 2  3  6  7 11 12]
[ 3  4  7  8 12 13]

但为了显示仅存在于中间数组的第4行,我必须添加更多代码来测试我们是否已经结束,以及是否添加填充等.我将把这个练习留给你,如果它真的很重要:)