Python中Pandas 方法cut简单讲讲

 

Pandas.cut 方法作用,刚刚接触pandas.cut方法时候一脸懵逼,这个到底是干什么的呢,输出也是很奇怪的复合内容。后来做了个下面两个小测试大概明白了。

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

网上查到的解释太玄幻,简单理解,主要作用就是把一个数(x),按照给定的评判组(bins)进行分类,确定这个数属于那个组,就返回,如果定义判断组的名字(labels),就按照名字返回。

 

比如有一组考生成绩,不直接给出成交,而是按照描述给定;那么评判组bins0-60是一组,60-80是一组,80-100是一组,描述labels0-60分属于不及格,60-80是及格,80-100是优秀。

那么就是如下

点击(此处)折叠或打开

  1. import numpy as np
  2. import pandas as pd
  3. grade = [80,75,32.5,100]
  4. bins = [0,60,80,100]
  5. group_names = [‘不及格’,‘及格’,‘优秀’]
  6. cats = pd.cut(grade, bins,labels = group_names)

 

输出:

[及格, 及格, 不及格, 优秀]

Categories (3, object): [不及格 < 及格 < 优秀]

第一个是我们要的,后面两个是附加说明评判组的定义。如果我们想返回原来判定标准, retbins=True即可。最后要注意的输入的数据x必须是队列或者numpy.array类型

    原文作者:张国平
    原文地址: http://blog.itpub.net/22259926/viewspace-2157078/
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞