回归综合案例 | 您所在的位置:网站首页 › 鲍鱼是什么属性 › 回归综合案例 |
回归综合案例——利用回归模型预测鲍鱼年龄
1 数据集探索性分析
首先将鲍鱼数据集abalone_dataset.csv读取为pandas的DataFrame格式。 import pandas as pd import warnings warnings.filterwarnings('ignore') data = pd.read_csv(r"C:\Users\86182\Desktop\abalone_dataset.csv") data.head()(4177,9) #查看数据信息,检查是否有缺失值 data.info()
观察sex列的取值分布情况。 import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline sns.countplot(x = "sex",data = data)
●例如从第一行可以看到鲍鱼的长度length 和鲍鱼直径diameter 、鲍鱼高度height 存在明显的线性关系。鲍鱼长度与鮑鱼的四种重量之间存在明显的非线性关系。 ●观察最后一行,鲍鱼环数rings 与各个特征均存在正相关性,中与height 的线性关系最为直观。 ●观察对角线上的直方图,可以看到幼鲍鱼( sex 取值为")在各个特征上的取值明显小于其他成年鲍鱼。而雄性鲍鱼( sex取值为“M")和雌性鲍鱼( sex 取值为“F")各个特征取值分布没有明显的差异。 为了定量地分析特征之间的线性相关性,我们计算特征之间的相关系数矩阵,并借助热力图将相关性可视化。 corr_df = data.corr() corr_df2.1 对sex特征进行Onehot编码,便于后续模型纳入哑变量 使用pandas的get_dummies函数对sex特征做Onehot编码处理。 sex_onehot = pd.get_dummies(data["sex"],prefix="sex") data[sex_onehot.columns] = sex_onehot data.head() |
CopyRight 2018-2019 实验室设备网 版权所有 |