numpy pandas matplotlib 常用API整理 您所在的位置:网站首页 matplotlib生成表格 numpy pandas matplotlib 常用API整理

numpy pandas matplotlib 常用API整理

#numpy pandas matplotlib 常用API整理| 来源: 网络整理| 查看: 265

python数据结构 python常用函数 numpy, pandas, matplotlib

整理python for ML常用的几个库,只是以表格形式给出,方便查阅,具体使用细节请参考官方API文档

import numpy as np ndarray.ndim:数组的轴(维度)的个数 ndarray.shape:对于有 n 行和 m 列的矩阵,shape 将是 (n,m) ndarray.size:数组元素的总数 ndarray.dtype:元素类型的对象,python标准类型或numpy.int32、numpy.int16和numpy.float64 ndarray.itemsize:数组中每个元素的字节大小

API作用输入参数返回值np.array()序列转换成一二三维数组list或者list套listndarraynp.zeros()创建一个由0组成的数组数组的shape元组(m,n)mn的全0数组np.ones()创建一个由1组成的数组数组的shape元组(m,n),dtypemn的全1数组np.empty()创建mn数组shape(mn)内容随机的数组np.arange()创建等差数组np.arange(start, end, step)d为step的等差数组,step可缺省np.linspace()创建等差数组start, end, num数目为num的等差数组np.eye()创建对角线全1的矩阵一个数,表示矩阵阶数单位矩阵np.random.random生成0到1之间的随机数np.random.randn生成标准正态的随机数np.random.uniform生成均勻分布的随机数np.random.normal生成正态分布

API作用输入参数返回值array.reshape(m,n)重组数组目的形状mn新重组数组array.resize(m,n)重组数组目的形状mn改变的是原数组array.sum()数组求和无数组所有元素总和array.sum(axis)对行或者列求和axis=0对应列求和,1为行求和返回一维和数组array.min()情况类似sumarray.max()情况类似sumarray.average()如果给出weight数组,则按照权重相乘求和array.flat数组迭代器,通过这个方法遍历array.all()array中全为true可指定axisarray.any()array中一个为true可指定axis

运算(A,B均为矩阵)

A*B:NumPy数组中按元素进行运算 A@B:矩阵乘法 A.dot(B):矩阵乘法

API作用输入参数返回值np.sin()np.exp()np.cos()np.sqrt()数组开根号np.ceil()数组元素向下取整np.floor()数组元素向上取整np.mean()求均值,可通过axis选择维度np.median()求中位数,可通过axis选择维度

>> b array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]])

切片格式作用b[2,3]定位2,3坐标的元素b[0:5, 1]0-4行,第一列元素切片b[:, 1]所有行,第一列元素切片 还可以通过数组索引

import pandas as pd

pd.Series()

s = pd.Series(np.random.randn(5), index=["a", "b", "c", "d", "e"]) pd.Series(np.random.randn(5)) pd.DataFrame(): d = {"one": [1.0, 2.0, 3.0, 4.0], "two": [4.0, 3.0, 2.0, 1.0]} pd.DataFrame(d, index=["a", "b", "c", "d"]) pd.read_csv():

参数作用选项filepath_or_buffer文件路径文件路径delimiter定界符,备选分隔符,sep 的别名如果指定该参数,则sep参数失效sep每行数据内容分隔符号,默认是 , 逗号默认逗号,另外常见的还有 tab 符 \t,空格等,根据数据实际的情况传值header支持 int, list of int,默认会把第一行作为表头0,[0,1,3],Noneindex_col用作行索引的列编号或者列名,如果给定一个序列则有多个行索引False, 0, ‘年份'(指定列名) ,[‘a’,’b’],[0, 3] (按列索引指定多个索引)names指定列名列表如果文件不包含列名,那么应该设置 header=None,列名列表中不允许有重复值,如[‘列1’, ‘列2′]encoding指定字符集类型’utf8’, “gb2312″chunksize文件块的大小,分块处理大型csv文件文件块的大小

按列访问: df["col_name"] 删除列: del df["col_name"] | df.pop("col_name") 插入列: df["new_col_name"] = df["old_col_name"][:2] df.insert(1, "bar", df["one"]) #args:(col_num, col_name, col) df.assign()

index / selection

OperationSyntaxResult选择列df[col]Series通过label选择行df.loc[label]Series通过数字选择行df.iloc[loc]Series切片df[5:10]DataFrame通过bool值选择行df[bool_vec]DataFrame

np.exp(df)

np.asarray(df)

df.info()

df.head(n) df.tail(n) df.index df.columns df.values

函数名参数功能pd.apply()

import matplotlib.pyplot as plt figure:画板 subplot:画纸 axis:坐标轴,xlabel, ylabel legend:图形中的内容 grid:网格中的虚线 marker:点的形状

Original: https://blog.csdn.net/good_jiojio/article/details/123620340Author: jiangcx_cpyTitle: numpy pandas matplotlib 常用API整理

相关阅读 Title: 设置pandas显示行数_Pandas这样来设置,做数据分析舒适百倍

在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。

而pandas有着自己的一套 「参数设置系统」,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识。

numpy pandas matplotlib 常用API整理

图1

1 设置DataFrame最大显示行数

pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子:

numpy pandas matplotlib 常用API整理

图2

在修改display.max_rows的参数值之后,我们的数据框只会显示指定行数的数据,中间的部分都会以省略号的形式显示,当我们的数据框行数较多,可以加大这个参数以显示更多行数据。

2 设置DataFrame最大显示列数

类似display.max_rows,通过修改display.max_columns我们可以调节最大显示的数据框列数(默认是20列),这在我们的数据框字段较多又想全部查看的时候很有用:

numpy pandas matplotlib 常用API整理

图3

3 设置每列的最大显示宽度

对于一些单元格内容长度较长的数据譬如长文本,在查看数据框时过长的部分会被简化为省略号,而通过修改display.max_colwidth参数我们可以在必要时,使得超长的部分也显示出来:

numpy pandas matplotlib 常用API整理

图4

4 指定小于某个数的元素显示为0

通过display.chop_threshold参数我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0:

numpy pandas matplotlib 常用API整理

图5

5 格式化浮点数

通过display.float_format参数我们可以设置浮点数的显示格式,譬如这里我们给浮点数加上¥前缀并设定保留两位小数:

numpy pandas matplotlib 常用API整理

图6

6 设置info()方法中非缺失值检查的行数上限

针对数据框的info()方法可以帮助我们查看数据框的一些概览信息,譬如每一列对应的非缺失值个数。

但默认情况下当数据框行数大于1690784行时,再查看info()信息,会处于计算效率的考虑略去缺失值检查信息。

这时我们可以通过设置display.max_info_rows参数来提高这个上限:

numpy pandas matplotlib 常用API整理

图7

7 控制小数打印的精度

控制数据框中小数的显示精度除了上文提到的方法之外,还可以通过修改display.precision参数来控制,默认是6位小数:

numpy pandas matplotlib 常用API整理

图8

8 临时修改参数

有时,我们只想更改一个表上的设置参数,而不想影响以后其他表的显示。

[En]

Sometimes we only want to change the setting parameters on a table and do not want to affect the display of other tables later.

这时除了用pd.reset_option()对指定的参数进行复原之外,我们还可以利用with关键词配合pd.option_context以临时的方式将指定的参数作用在局部范围内:

numpy pandas matplotlib 常用API整理

图9

Original: https://blog.csdn.net/weixin_31176383/article/details/113534520Author: vabaTitle: 设置pandas显示行数_Pandas这样来设置,做数据分析舒适百倍

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/320925/

转载文章受原作者版权保护。转载请注明原作者出处!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有