pandas（二）

2023年11月30日 170次阅读来源: saber丶吾王

层级索引：

　　index=[(‘a’,2010),(‘b’,2011),(‘c’,2010′),(‘a’,2012),(‘e’,2010),(‘f’,2011)]

　　age=[18,17,18,16,18,17]

常规创建

　　pop =pd.Series(age,index=index)

MultiIndex创建

　　index= pd.MultiIndex.from_tuples(index)

　　pop = pop.reindex(index) 最原先的索引重置为multiindex

　　pop[:,2010] 取出2010的所有数据

高维数据的多级索引：

　　pop_df = pop.unstack()

　　本质是生成一个a-f为行索引，年份为列索引的矩阵，缺失值用nan

　　pop = pop_df.stack() 和unstack相反

多级索引创建：

　　直接将index参数设为二维

　　df = pd.DataFrame(np.random.rand(4,2),

　　　　　　　　　　　　　　index=[[‘a’,’a’,’c’,’d’],[1,2,1,1]],

　　　　　　　　　　　　　　columns=[‘data1′,’data2’])

　　将元祖作为键的字典传入

　　data = {(‘a’,1):18,(‘a’,2):19,(‘b’,1):20}

　　pd.Series(data)　　

　　显式创建多级索引

　　pd.MultiIndex.from_arrays([[‘a’,’a’,’b’,’b’],[1,2,1,2]])

　　pd.MultiIndex.from_tuples([(‘a’,1),(‘a’,2),(‘b’,1),(‘b’,2)])　　

多级索引等级名称

　　pop.index.names=[‘name’,’year’] 以前面例子来说给name是a一列的名称，year是2010一列的形成

Series多级索引

获取单个元素：

　　pop[‘a’,2010]

　　也可以支持局部取值

　　pop[‘a’]

　　局部切片

　　pop[‘a’:’c’] 但要求muliIndex按顺序排列

　　pop[:,2012]

　　pop[pop>18]

　　pop[[‘a’,’b’]]

    原文作者：saber丶吾王
    原文地址: https://www.cnblogs.com/saber-xi/p/10642917.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。