Pandas数据分析常用的函数

1.汇总函数

Pandas中大量的函数可以说是初学者最头疼的事情了,以下介绍的函数是我本人认为比较常用的一些,我们一起来学习演示一下,希望对大家有帮助。

学习了Pandas的数据结构我们知道Series和DataFrame中存储了很多的信息,但是大多数时候我们其实只是想看其中的一部分,这时候就可以使用head()函数和tail(),它们分别代表返回n行表头数据或者是末尾数据。

输入head(5),显示前5行数据

输入tail(5),显示末尾5行数据

info()和describe()分别返回数据集的信息概况和描述性统计。

输入df.info(),可以快速的查列名,是否存在空值,字段类型,以及文档的大小等。

输入df.describe(),可以快速的查看数值型字段的描述性统计。

其实,info()和describe()展现的信息其实是非常的有限的,如果想要实现对数据集更全面有效的观察,可以使用pandas-profiling包。

2.特征统计函数

在Series和DataFrame中其实定义了很多的统计函数,但是最常用的无非就是求和、均值、中位数、方差、最大值、最小值等。

均值,mean()

最大值,max()

还有就是quantile()、count、idxmax(),他们分别返回是分位数、非缺失值个数、最大值的索引;

返回四分之一位数,df.quantile(0.25)

数据计数,df.count()

返回最大值的索引,df.idmax()(最小值索引idmin())

上述的函数每一个序列进行操作之后返回的结果都是标量,因此又被称为聚合函数,都有一个公共的参数axis,默认为0,记得之前内容的都知道,0代表行,1 代表列,如果设置为1,则会逐行的去聚合。

3.频次函数

使用unique()和nunique()可以分别得到其唯一值组成的列表和唯一值得个数:

value_count()可以得到序列中每个值出现的次数,当参数normalize为True时会进行归一化处理。

删除重复值:观察多个列组合的唯一值,可以使用drop_duplicates(),其中的关键参数是Keep,默认值为first表示保留每个组合第一次出现所在的行,指定为last表示保留每个组合最后一次出现的所在行,指定为False表示把所有组合重复的所在行删除。

duplicated()和drop_duplicates()的功能类似,前者返回的是元素是否唯一的布尔值。

4.替换函数

替换一般是指对某一个列进行的,在pandas中替换可以被归纳为3类,映射替换、逻辑替换、数值替换。

在replace()中,可以通过字典构造或传入列表来进行替换:

replace()中的一个特殊替换方式是,指定参数method为ffill是用前面一个最近的末尾的未被替换的值进行替换,为bfill时,用后面最近的未被替换的值进行替换。

逻辑替换包括where()和mask(),where在传入的条件为False的对应行进行替换,而mask()在传入条件为True的对应行进行替换,当未对二者指定替换时,将对应值填充为缺失值。

数值的替换有round()、abs()、clip()它们分别表示按照给定的精度四舍五入。

5.排序函数

Pandas中有两种排序函数,第一种是值排序函数sort_values(),第二种是索引排序函数sort_index()。参数ascending为True时为升序。

ascending=False时为降序排序

遇到多列排序问题时,可以使用列表来传入参数来实现,身高降序、体重升序;

索引排序与值的排序方法几乎一致。

Panels中得rank()函数与元素得排序相关,返回每个元素在整个序列中的排名,ascending表示升序排序,pct表示是否返回对应的分位数。

6.apply()函数

apply()函数常用于DataFrame进行行迭代或者列的迭代,apply的参数往往时一个以序列输入的函数。

例如使用apply()来实现求均值:

当axis = 1时,就是列的均值,

虽然apply如此强大,但是并不意味着其他的函数没有用,apply()的灵活性时在牺牲效率的前提下获得的,所以想要高效的完成任务,还是使用对应的函数比较好。

展开阅读全文

页面更新:2024-04-19

标签:函数   升序   数据   组合   最大值   末尾   位数   序列   索引   常用   参数

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top