0

0

pandas技巧之 DataFrame中的排序与汇总方法

coldplay.xixi

coldplay.xixi

发布时间:2020-09-17 16:53:22

|

4800人浏览过

|

来源于juejin

转载

pandas技巧之  DataFrame中的排序与汇总方法

相关学习推荐:python教程

今天是pandas数据处理专题的第六篇文章,我们来聊聊DataFrame的排序与汇总运算。

在上一篇文章当中我们主要介绍了DataFrame当中的apply方法,如何在一个DataFrame对每一行或者是每一列进行广播运算,使得我们可以在很短的时间内处理整份数据。今天我们来聊聊如何对一个DataFrame根据我们的需要进行排序以及一些汇总运算的使用方法。

排序

排序是我们一个非常基本的需求,在pandas当中将这个需求进一步细分,细分成了根据索引排序以及根据值排序。我们先来看看Series当中的排序方法。

Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。这两个方法都会返回一个新的Series:

索引排序

对于DataFrame来说也是一样,同样有根据值排序以及根据索引排序这两个功能。但是由于DataFrame是一个二维的数据,所以在使用上会有些不同。最简单的差别是在于Series只有一列,我们明确的知道排序的对象,但是DataFrame不是,它当中的索引就分为两种,分别是行索引以及列索引。所以我们在排序的时候需要指定我们想要排序的轴,也就是axis。

默认的情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。

我们还可以传入ascending这个参数,用来指定我们想要的排序顺序是正序还是倒序

值排序

DataFrame的值排序有所不同,我们不能对行进行排序,只能针对列。我们通过by参数传入我们希望排序参照的列,可以是一列也可以是多列。

排名

有的时候我们希望得到元素的排名,我们会希望知道当前元素在整体当中排第几,pandas当中也提供了这个功能,它就是rank方法。

我们可以发现我们随手输入的一串数字当中,包含两个7,7是Series当中最大的数字,但是它们的排名为什么是6.5呢?

其实很简单,因为7出现了两次,分别是第6位和第7位,这里对它所有出现的排名取了平均,所以是6.5。如果我们不希望它取平均,而是根据出现的先后顺序给出排名的话,我们可以用method参数指定我们希望的效果。

method的合法参数并不止first这一种,还有一些其他稍微冷门一些的用法,我们一并列出。

如果是DataFrame的话,默认是以行为单位,计算每一行中元素占整体的排名。我们也可以通过axis参数指定以列为单位计算:

汇总运算

最后我们来介绍一下DataFrame当中的汇总运算,汇总运算也就是聚合运算,比如我们最常见的sum方法,对一批数据进行聚合求和。DataFrame当中同样有类似的方法,我们一个一个来看。

首先是sum,我们可以使用sum来对DataFrame进行求和,如果不传任何参数,默认是对每一行进行求和。

除了sum之外,另一个常用的就是mean,可以针对一行或者是一列求平均。

由于DataFrame当中常常会有为NA的元素,所以我们可以通过skipna这个参数排除掉缺失值之后再计算平均值。

另一个我个人觉得很好用的方法是descirbe,可以返回DataFrame当中的整体信息。比如每一列的均值、样本数量、标准差、最小值、最大值等等。是一个常用的统计方法,可以用来了解DataFrame当中数据的分布情况。

除了介绍的这些方法之外,DataFrame当中还有很多类似的汇总运算方法,比如idxmax,idxmin,var,std等等,大家感兴趣可以去查阅相关文档,但是根据我的经验一般用不到。

想了解更多编程学习,敬请关注php培训栏目!

星辰Agent
星辰Agent

科大讯飞推出的智能体Agent开发平台,助力开发者快速搭建生产级智能体

下载

相关专题

更多
菜鸟裹裹入口以及教程汇总
菜鸟裹裹入口以及教程汇总

本专题整合了菜鸟裹裹入口地址及教程分享,阅读专题下面的文章了解更多详细内容。

0

2026.01.22

Golang 性能分析与pprof调优实战
Golang 性能分析与pprof调优实战

本专题系统讲解 Golang 应用的性能分析与调优方法,重点覆盖 pprof 的使用方式,包括 CPU、内存、阻塞与 goroutine 分析,火焰图解读,常见性能瓶颈定位思路,以及在真实项目中进行针对性优化的实践技巧。通过案例讲解,帮助开发者掌握 用数据驱动的方式持续提升 Go 程序性能与稳定性。

9

2026.01.22

html编辑相关教程合集
html编辑相关教程合集

本专题整合了html编辑相关教程合集,阅读专题下面的文章了解更多详细内容。

56

2026.01.21

三角洲入口地址合集
三角洲入口地址合集

本专题整合了三角洲入口地址合集,阅读专题下面的文章了解更多详细内容。

51

2026.01.21

AO3中文版入口地址大全
AO3中文版入口地址大全

本专题整合了AO3中文版入口地址大全,阅读专题下面的的文章了解更多详细内容。

397

2026.01.21

妖精漫画入口地址合集
妖精漫画入口地址合集

本专题整合了妖精漫画入口地址合集,阅读专题下面的文章了解更多详细内容。

118

2026.01.21

java版本选择建议
java版本选择建议

本专题整合了java版本相关合集,阅读专题下面的文章了解更多详细内容。

3

2026.01.21

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

16

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

11

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Pandas 教程
Pandas 教程

共15课时 | 0.9万人学习

最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 13.4万人学习

Django 教程
Django 教程

共28课时 | 3.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号