文章目录
现实场景
有一堆数据,表示的是语音识别的效果(用相似度得分表示),需要找到每个测试人员最高分数对应的那个对象(判别结果)。
数据
data = { "tet":["Anna", "Anna", "Bob", "Bob"], "name":["Candy", "Duck", "Candy", "Duck" ], "scores":["254", "390", "450", "178"]}
df = pd.DataFrame(data)
df
tet name scores
0 Anna Candy 254
1 Anna Duck 390
2 Bob Candy 450
3 Bob Duck 178
虽然此刻能够很清楚地看到Anna与Duck的分数最高,但是如果比对的人不止这么一两个,就很难再通过肉眼观察到结果了,只能想办法找到tet
的scores
取值最高所对应的那个name
。
方法
试过直接使用透视图:
(Python 透视图pivot_table的用法:点击)
import pandas as pd
table = pd.pivot_table(df, index='tet', aggfunc=max)
table
scores
tet
Anna 390
Bob 450
不过暂时不知道如何返回最大scores
对应的那个name
。
最后成功的做法是使用groupby
+dataframe 的idxmax
函数:
ind = df.groupby('tet')['scores'].idxmax()
row = df.iloc[ind,:]
print(ind)
print(row)
后续
什么时候有空,对各种返回最大最小值的索引做一个总结:
python内置:max、min;
nump:argmax、argmin;
pandas:idxmax、idxmin;
参考: