numpy pandas matplotlib 常用API整理 | 您所在的位置:网站首页 › matplotlib生成表格 › numpy pandas matplotlib 常用API整理 |
python数据结构
python常用函数
numpy, pandas, matplotlib
整理python for ML常用的几个库,只是以表格形式给出,方便查阅,具体使用细节请参考官方API文档 import numpy as np ndarray.ndim:数组的轴(维度)的个数 ndarray.shape:对于有 n 行和 m 列的矩阵,shape 将是 (n,m) ndarray.size:数组元素的总数 ndarray.dtype:元素类型的对象,python标准类型或numpy.int32、numpy.int16和numpy.float64 ndarray.itemsize:数组中每个元素的字节大小API作用输入参数返回值np.array()序列转换成一二三维数组list或者list套listndarraynp.zeros()创建一个由0组成的数组数组的shape元组(m,n)mn的全0数组np.ones()创建一个由1组成的数组数组的shape元组(m,n),dtypemn的全1数组np.empty()创建mn数组shape(mn)内容随机的数组np.arange()创建等差数组np.arange(start, end, step)d为step的等差数组,step可缺省np.linspace()创建等差数组start, end, num数目为num的等差数组np.eye()创建对角线全1的矩阵一个数,表示矩阵阶数单位矩阵np.random.random生成0到1之间的随机数np.random.randn生成标准正态的随机数np.random.uniform生成均勻分布的随机数np.random.normal生成正态分布 API作用输入参数返回值array.reshape(m,n)重组数组目的形状mn新重组数组array.resize(m,n)重组数组目的形状mn改变的是原数组array.sum()数组求和无数组所有元素总和array.sum(axis)对行或者列求和axis=0对应列求和,1为行求和返回一维和数组array.min()情况类似sumarray.max()情况类似sumarray.average()如果给出weight数组,则按照权重相乘求和array.flat数组迭代器,通过这个方法遍历array.all()array中全为true可指定axisarray.any()array中一个为true可指定axis 运算(A,B均为矩阵) A*B:NumPy数组中按元素进行运算 A@B:矩阵乘法 A.dot(B):矩阵乘法API作用输入参数返回值np.sin()np.exp()np.cos()np.sqrt()数组开根号np.ceil()数组元素向下取整np.floor()数组元素向上取整np.mean()求均值,可通过axis选择维度np.median()求中位数,可通过axis选择维度 >> b array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]])切片格式作用b[2,3]定位2,3坐标的元素b[0:5, 1]0-4行,第一列元素切片b[:, 1]所有行,第一列元素切片 还可以通过数组索引 import pandas as pdpd.Series() s = pd.Series(np.random.randn(5), index=["a", "b", "c", "d", "e"]) pd.Series(np.random.randn(5)) pd.DataFrame(): d = {"one": [1.0, 2.0, 3.0, 4.0], "two": [4.0, 3.0, 2.0, 1.0]} pd.DataFrame(d, index=["a", "b", "c", "d"]) pd.read_csv():参数作用选项filepath_or_buffer文件路径文件路径delimiter定界符,备选分隔符,sep 的别名如果指定该参数,则sep参数失效sep每行数据内容分隔符号,默认是 , 逗号默认逗号,另外常见的还有 tab 符 \t,空格等,根据数据实际的情况传值header支持 int, list of int,默认会把第一行作为表头0,[0,1,3],Noneindex_col用作行索引的列编号或者列名,如果给定一个序列则有多个行索引False, 0, ‘年份'(指定列名) ,[‘a’,’b’],[0, 3] (按列索引指定多个索引)names指定列名列表如果文件不包含列名,那么应该设置 header=None,列名列表中不允许有重复值,如[‘列1’, ‘列2′]encoding指定字符集类型’utf8’, “gb2312″chunksize文件块的大小,分块处理大型csv文件文件块的大小 按列访问: df["col_name"] 删除列: del df["col_name"] | df.pop("col_name") 插入列: df["new_col_name"] = df["old_col_name"][:2] df.insert(1, "bar", df["one"]) #args:(col_num, col_name, col) df.assign()index / selection OperationSyntaxResult选择列df[col]Series通过label选择行df.loc[label]Series通过数字选择行df.iloc[loc]Series切片df[5:10]DataFrame通过bool值选择行df[bool_vec]DataFrame np.exp(df)np.asarray(df) df.info() df.head(n) df.tail(n) df.index df.columns df.values函数名参数功能pd.apply() import matplotlib.pyplot as plt figure:画板 subplot:画纸 axis:坐标轴,xlabel, ylabel legend:图形中的内容 grid:网格中的虚线 marker:点的形状Original: https://blog.csdn.net/good_jiojio/article/details/123620340Author: jiangcx_cpyTitle: numpy pandas matplotlib 常用API整理 相关阅读 Title: 设置pandas显示行数_Pandas这样来设置,做数据分析舒适百倍在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。 而pandas有着自己的一套 「参数设置系统」,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识。 ![]() 图1 1 设置DataFrame最大显示行数pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子: ![]() 图2 在修改display.max_rows的参数值之后,我们的数据框只会显示指定行数的数据,中间的部分都会以省略号的形式显示,当我们的数据框行数较多,可以加大这个参数以显示更多行数据。 2 设置DataFrame最大显示列数类似display.max_rows,通过修改display.max_columns我们可以调节最大显示的数据框列数(默认是20列),这在我们的数据框字段较多又想全部查看的时候很有用: ![]() 图3 3 设置每列的最大显示宽度对于一些单元格内容长度较长的数据譬如长文本,在查看数据框时过长的部分会被简化为省略号,而通过修改display.max_colwidth参数我们可以在必要时,使得超长的部分也显示出来: ![]() 图4 4 指定小于某个数的元素显示为0通过display.chop_threshold参数我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0: ![]() 图5 5 格式化浮点数通过display.float_format参数我们可以设置浮点数的显示格式,譬如这里我们给浮点数加上¥前缀并设定保留两位小数: ![]() 图6 6 设置info()方法中非缺失值检查的行数上限针对数据框的info()方法可以帮助我们查看数据框的一些概览信息,譬如每一列对应的非缺失值个数。 但默认情况下当数据框行数大于1690784行时,再查看info()信息,会处于计算效率的考虑略去缺失值检查信息。 这时我们可以通过设置display.max_info_rows参数来提高这个上限: ![]() 图7 7 控制小数打印的精度控制数据框中小数的显示精度除了上文提到的方法之外,还可以通过修改display.precision参数来控制,默认是6位小数: ![]() 图8 8 临时修改参数有时,我们只想更改一个表上的设置参数,而不想影响以后其他表的显示。 [En]Sometimes we only want to change the setting parameters on a table and do not want to affect the display of other tables later. 这时除了用pd.reset_option()对指定的参数进行复原之外,我们还可以利用with关键词配合pd.option_context以临时的方式将指定的参数作用在局部范围内: ![]() 图9 Original: https://blog.csdn.net/weixin_31176383/article/details/113534520Author: vabaTitle: 设置pandas显示行数_Pandas这样来设置,做数据分析舒适百倍 原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/320925/ 转载文章受原作者版权保护。转载请注明原作者出处! |
今日新闻 |
推荐新闻 |
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 |