pandas统计数据项重复值次数和删除

整体代码:

import numpy as np
import pandas as pd

# 原始数据
df = pd.DataFrame({ 'key1':['a','a','b','b','a','a'],
                'key2':['one','one','one','two','one','one'],
                'data1':[1,1,2,2,3,3],
# 'data2':np.random.randn(6)
                })
df

df.duplicated()#查看是否有重复
-df.duplicated()

dup=df[df.duplicated()]#重复

df[df.duplicated()].count()#重复个数

nodup=df[-df.duplicated()]#重复去除
nodup

图片:
《pandas统计数据项重复值次数和删除》
《pandas统计数据项重复值次数和删除》

分解看:

import numpy as np
import pandas as pd
# 原始数据
df = pd.DataFrame({ 'key1':['a','a','b','b','a','a'],
                'key2':['one','one','one','two','one','one'],
                'data1':[1,1,2,2,3,3],
# 'data2':np.random.randn(6)
                })
df

《pandas统计数据项重复值次数和删除》

df.duplicated()#查看是否有重复
-df.duplicated()

《pandas统计数据项重复值次数和删除》

dup=df[df.duplicated()]#重复

《pandas统计数据项重复值次数和删除》

df[df.duplicated()].count()#重复个数

《pandas统计数据项重复值次数和删除》

nodup=df[-df.duplicated()]#重复去除
nodup

《pandas统计数据项重复值次数和删除》

    原文作者:xiaofei-liu
    原文地址: https://blog.csdn.net/qq_35690171/article/details/103704392
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞