pandas中Series和DataFrame的rank方法详解

rank方法的作用是计算出axis方向上各个data的排名(指出这些data排好序后的名次)

函数原型

Series.rank(axis=0,method='average',numeric_only=None,na_option='keep',ascending=True,pct=False)
该方法用来排名(名次值从1开始),它可以根据某种规则破坏平级关系,
默认情况下,让人情况下(method='average'),rank通过“为各组分配一个平均排名”的方式破坏平级关系。

各参数的作用

  1. axis:{0 or 'index',1 or 'columns'} default 0
    即默认按沿着index方向排名
  2. method:{'average','min','max','first','dense'}
    指定排名时用于破坏平级关系的method选项(注:值相同的位同一个分组)

    method说明
    ‘average’默认:在相等分组中,为各个值分配平均排名
    ‘min’使用整个整个分组的最小排名
    ‘max’使用整个分组的最大排名
    ‘first’按值在原始数据中的出现顺序分配排名
    ‘dense’与’min’类似,但是排名每次只会增加1,即并列的数据只占据一个名次
  3. ascending
    是否为升序,默认为True
  4. na_option用于处理NaN值

    na_option说明
    ‘keep’leave NA values where they are
    ‘top’smallest rank if ascending
    ‘bottom’smallest rank if dscending

    pct

    更多详情可参考pandas文档

    5. 名次是否为百分数
    原文作者:AGUILLER
    原文地址: https://segmentfault.com/a/1190000012917040
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞