我正在执行功能,我按ID分组,并使用此代码为
python汇总与这些ID相关联的$值:
df = df.groupby([' Id'], as_index=False, sort=False)[["Amount"]].sum();
但它没有重命名列.因此,我尝试这样做:
`df = df.groupby([' Id'], as_index=False, sort=False)`[["Amount"]].sum();.reset_index(name ='Total Amount')
但它给了我错误,TypeError:reset_index()得到了一个意外的关键字参数’name’
所以我最后在这篇文章后尝试这样做:Python Pandas Create New Column with Groupby().Sum()
df = df.groupby(['Id'])[["Amount"]].transform('sum');
但它仍然没有奏效.
我究竟做错了什么?
最佳答案 我认为您需要删除参数as_index = False并使用
Series.reset_index
,因为此参数返回df,然后
DataFrame.reset_index
参数名称失败:
df = df.groupby('Id', sort=False)["Amount"].sum().reset_index(name ='Total Amount')
或者首先重命名列:
d = {'Amount':'Total Amount'}
df = df.rename(columns=d).groupby('Id', sort=False, as_index=False)["Total Amount"].sum()
样品:
df = pd.DataFrame({'Id':[1,2,2],'Amount':[10, 30,50]})
print (df)
Amount Id
0 10 1
1 30 2
2 50 2
df1 = df.groupby('Id', sort=False)["Amount"].sum().reset_index(name ='Total Amount')
print (df1)
Id Total Amount
0 1 10
1 2 80
d = {'Amount':'Total Amount'}
df1 = df.rename(columns=d).groupby('Id', sort=False, as_index=False)["Total Amount"].sum()
print (df1)
Id Total Amount
0 1 10
1 2 80
但是如果需要在原始df中使用sum的新列使用transform
并将输出分配给新列:
df['Total Amount'] = df.groupby('Id', sort=False)["Amount"].transform('sum')
print (df)
Amount Id Total Amount
0 10 1 10
1 30 2 80
2 50 2 80