Python中pandas的层级索引是什么
不懂Python中pandas的层级索引是什么?其实想解决这个问题也不难,下面让小编带着大家一起学习怎么去解决,希望大家阅读完这篇文章后大所收获。
1、认识层级索引
以下示例将创建一个 Series 对象, 索引 Index 由两个子 list 组成,第一个子 list 是外层索引,第二个 list 是内层索引:
>>>importpandasaspd>>>importnumpyasnp>>>obj=pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]])>>>obja0-0.2015361-0.62905820.766716b0-1.2558311-0.4837272-0.018653c00.78878711.0100972-0.187258d01.2423631-0.8220112-0.085682dtype:float64
2、MultiIndex 索引对象
尝试打印上面示例中 Series 的索引类型,会得到一个 MultiIndex 对象,MultiIndex 对象的levels属性表示两个层级中分别有那些标签,codes属性表示每个位置分别是什么标签,如下所示:
>>>importpandasaspd>>>importnumpyasnp>>>obj=pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]])>>>obja00.0359461-0.8672152-0.053355b0-0.98661610.0260712-0.048394c00.25127410.21779021.137674d0-1.24517811.2349722-0.035624dtype:float64>>>>>>type(obj.index)<class'pandas.core.indexes.multi.MultiIndex'>>>>>>>obj.indexMultiIndex([('a',0),('a',1),('a',2),('b',0),('b',1),('b',2),('c',0),('c',1),('c',2),('d',0),('d',1),('d',2)],)>>>obj.index.levelsFrozenList([['a','b','c','d'],[0,1,2]])>>>>>>obj.index.codesFrozenList([[0,0,0,1,1,1,2,2,2,3,3,3],[0,1,2,0,1,2,0,1,2,0,1,2]])
通常可以使用 from_arrays() 方法来将数组对象转换为 MultiIndex 索引对象:
>>>arrays=[[1,1,2,2],['red','blue','red','blue']]>>>pd.MultiIndex.from_arrays(arrays,names=('number','color'))MultiIndex([(1,'red'),(1,'blue'),(2,'red'),(2,'blue')],names=['number','color'])
其他常用方法见下图:
3、提取值
对于这种有多层索引的对象,如果只传入一个参数,则会对外层索引进行提取,其中包含对应所有的内层索引,如果传入两个参数,则第一个参数表示外层索引,第二个参数表示内层索引,示例如下:
>>>importpandasaspd>>>importnumpyasnp>>>obj=pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]])>>>obja00.55020210.32878421.422690b0-1.3334771-0.9338092-0.326541c00.66368610.94339320.273106d01.3540371-2.3128472-2.343777dtype:float64>>>>>>obj['b']0-1.3334771-0.9338092-0.326541dtype:float64>>>>>>obj['b',1]-0.9338094811708413>>>>>>obj[:,2]a1.422690b-0.326541c0.273106d-2.343777dtype:float64
4、交换分层与排序
MultiIndex 对象的 swaplevel() 方法可以交换外层与内层索引,sortlevel() 方法会先对外层索引进行排序,再对内层索引进行排序,默认是升序,如果设置 ascending 参数为 False 则会降序排列,示例如下:
>>>importpandasaspd>>>importnumpyasnp>>>obj=pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','c','d','d','d'],[0,1,2,0,1,2,0,1,2,0,1,2]])>>>obja0-0.11021510.1930752-1.101706b0-1.32574310.5284182-0.127081c0-0.73382211.66526220.127073d01.2620221-1.17051820.966334dtype:float64>>>>>>obj.swaplevel()0a-0.1102151a0.1930752a-1.1017060b-1.3257431b0.5284182b-0.1270810c-0.7338221c1.6652622c0.1270730d1.2620221d-1.1705182d0.966334dtype:float64>>>>>>obj.swaplevel().index.sortlevel()(MultiIndex([(0,'a'),(0,'b'),(0,'c'),(0,'d'),(1,'a'),(1,'b'),(1,'c'),(1,'d'),(2,'a'),(2,'b'),(2,'c'),(2,'d')],),array([0,3,6,9,1,4,7,10,2,5,8,11],dtype=int32))
感谢你能够认真阅读完这篇文章,希望小编分享Python中pandas的层级索引是什么内容对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,遇到问题就找亿速云,详细的解决方法等着你来学习!
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。