pandas处理csv文件求一列的平均值 | 您所在的位置:网站首页 › python计算最大值最小值和平均值的区别 › pandas处理csv文件求一列的平均值 |
/前言/ 前几天群里有个小伙伴问了一个问题,关于Python读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值,大家讨论的甚为激烈,在此总结了两个方法,希望后面有遇到该问题的小伙伴可以少走弯路。 /一、问题描述/ 如果想求CSV或者Excel中的最大值或者最小值,我们一般借助Excel中的自带函数max()和min()就可以求出来。如果只是一两个文件,处理起来肯定是小菜一碟了,当文件的个数达到上百个,如果再按照该方法进行的话,那可就费时费力了,事倍功半。 不过白慌,针对下图中的多个CSV文件,我们可以利用Python来一次性遍历读取多个文件,然后分别对文件进行处理,事半功倍。 /二、解决方法/ 1、首先来看看文件内容,这里取其中一个文件的内容,如下图所示。 当然这只是文件内容中的一小部分,真实的数据量绝对不是21个。 2、现在我们想对第一列或者第二列等数据进行操作,以最大值和最小值的求取为例,这里以第一列为目标数据,来进行求值。 通常我们通过Python来处理数据,用的比较多的两个库就是numpy和pandas,在本篇文章中,将分别利用两个库来进行操作。 3、其中使用pandas库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。 4、通过pandas库求取的结果如下图所示。 通过该方法,便可以快速的取到文件夹下所有文件的第一列的最大值和最小值。 5、下面使用numpy库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。 6、通过numpy库求取的结果如下图所示。 通过该方法,也可以快速的取到文件夹下所有文件的第一列的最大值和最小值。 /小结/ 本文基于Python,使用numpy库和pandas库实现了读取文件夹下多个CSV文件,并求取文件中第一列数据的最大值和最小值,当然除了这两种方法之外,肯定还有其他的方法也可以做得到的,欢迎大家积极探讨。 Python学习交流群 为了让大家更加即时地沟通学习,我们建了一个Python学习交流群,有想入群的同学,可以添加下面小助手微信,他会拉大家入群哈~ |
CopyRight 2018-2019 实验室设备网 版权所有 |