python – Pandas ValueError返回的形状与数据帧形状不匹配?

我的理解是pd.DataFrame().shapereturns(n_rows,n_columns).

但是,当构造数据帧并且索引与数据形状不匹配时,pandas会将形状为(n_columns,n_rows)的ValueError引发.

例:

df_2 = pd.DataFrame(np.random.randn(10,2), index = range(9))

ValueError: Shape of passed values is (2, 10), indices imply (2, 9)

为什么不会打印ValueError:

传递值的形状是(10,2),指数暗示(9,2)

熊猫版:’0.17.1′

最佳答案 当pandas在这里说“indices”时它意味着索引和列(它们都是Index类型).

In [11]: df = pd.DataFrame(np.random.randn(3,2))

In [12]: df.index
Out[12]: Int64Index([0, 1, 2], dtype='int64')

In [13]: df.columns
Out[13]: Int64Index([0, 1], dtype='int64')

你传递的东西长度为9 .index索引,长度为2 .columns索引,因此错误信息……
也就是说:您的代码相当于:

In [21]: df = pd.DataFrame(np.random.randn(10,2), index=np.arange(9), columns=np.arange(2))
ValueError: Shape of passed values is (2, 10), indices imply (2, 9)

当你想要的是:

df = pd.DataFrame(np.random.randn(10,2), index=np.arange(10), colummns=np.arange(2))
# equivalently
df = pd.DataFrame(np.random.randn(10,2), index=np.arange(10))
df = pd.DataFrame(np.random.randn(10,2))
点赞