关于python:如何在Pandas中对数据透视表进行排序 |
您所在的位置:网站首页 › 数据透视表按大小排序 › 关于python:如何在Pandas中对数据透视表进行排序 |
这是代码: 12test = pd.DataFrame({'country':['us','ca','ru','cn','ru','cn','us','ca','ru','cn','us','ca','ru','cn','us','ca'], 'month':[5,6,7,5,6,7,5,5,6,7,5,6,6,5,5,6], 'id':[x for x in range(16)]}) p = test.pivot_table(index=['month', 'country'], aggfunc='count')[['id']]输出看起来像这样:
我想按id列对表格进行排序,以便最大的数字显示在顶部,例如: 12345 id month country us 4 5 cn 2 ca 1您需要DataFrame.reset_index,DataFrame.sort_values和DataFrame.set_index: 12345678910111213p1 = p.reset_index() .sort_values(['month','id'], ascending=[1,0]) .set_index(['month','country']) print (p1) id month country 5 us 4 cn 2 ca 1 6 ca 3 ru 3 7 cn 2 ru 1因为此解决方案不起作用:( 123456789101112p1 = p.sort_index(level='month', sort_remaining=True) \ .sort_values('id', ascending=False) print (p1) id month country 5 us 4 6 ca 3 ru 3 5 cn 2 7 cn 2 5 ca 1 7 ru 1 相关讨论 那不起作用的解决方案是一个错误吗? @ScottBoston-真的很难回答,我尝试在pandas github中找到有关它的一些问题,但这是不必要的。 :(选项1 在索引中由month级别定义的组中,按id排序 12345678910111213p.groupby( level='month', group_keys=False ).apply(pd.DataFrame.sort_values, by='id', ascending=False) id month country 5 us 4 cn 2 ca 1 6 ca 3 ru 3 7 cn 2 ru 1选项2 这首先将整个数据帧按id排序,然后再次按索引中的month级别排序。 但是,出于不言而喻的原因,我不得不使用sort_remaining=False和kind='mergesort',因为mergesort是稳定的排序,不会与"月"级别定义的组中的现有顺序混淆。 123456789101112p.sort_values('id', ascending=False) \ .sort_index(level='month', sort_remaining=False, kind='mergesort') id month country 5 us 4 cn 2 ca 1 6 ca 3 ru 3 7 cn 2 ru 1选项3 这使用numpy的lexsort ...可行,但是我不喜欢它,因为它取决于id是数字,并且我能够在其前面加上负数以获得降序。 /耸肩 1234567891011p.iloc[np.lexsort([-p.id.values, p.index.get_level_values('month')])] id month country 5 us 4 cn 2 ca 1 6 ca 3 ru 3 7 cn 2 ru 1 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |