R语言中的逐步回归 绘制ROC曲线 r语言做回归分析的命令 | 您所在的位置:网站首页 › stata做回归分析命令reg › R语言中的逐步回归 绘制ROC曲线 r语言做回归分析的命令 |
回归分析回归回归分析类型简单线性回归lm()函数线性拟合常用函数可视化:plot()多元回归逐步回归法全子集回归法 回归 根据一大堆数据,找到内在规律 (模拟一个最好的解释曲线,由自变量可以计算得到因变量) 回归分析类型回归分析简单可以分为线性回归和非线性回归: 线性回归:简单线性、多项式、多元线性、Logistic回归等(类似于一元一次方程、一元多次方程、多元多次方程) 非线性回归: 简单线性回归注:线性回归一般用最小二乘回归法(OLS) lm()函数说明: 可用于拟合线性模型,执行回归、方差单层分析和协方差分析用法: lm(formula, data, subset, weights, na.action, method = “qr”, model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, contrasts = NULL, offset, …)示例: fit |t|):估计系数为0假设的概率 小于0.05比较好Signif. codes:(显著性)对t和P进行标记 三星最好Residual standard error:(残差标准误差) 越小越好Multiple R-squared:(R方)回归模型所能解释的响应变量的方差比例。越大越好 例如:图表表示这个模型能够解释数据集中99.1%的数据,只有0.9%的不符合这个模型F-statistic: (F统计量)说明模型用线性拟合显著,P越小越好线性拟合常用函数可视化:plot()直接生成分析结果图> plot(fit)生成:残差拟合图,正态QQ图,大小位置图,残差影响图 绘制位置拟合曲线#绘制身高和体重位置图 > plot(women$height,women$weight) #画出拟合图线 > abline(fit)多元回归多元回归函数同样是lm(),只是包含多个自变量,并用“+”连接起来 若各个变量之间存在交互,则可以用“:”作为交互变量 多个变量间不能一一交互,此时考虑逐步回归法和全子集回归法 逐步回归法逐步回归法分为“先前逐步回归”和“向后逐步回归” 全子集回归法Adjust R2、Cp、BIC是三个用来评价模型的统计量; Adjust R2越接近1说明模型拟合得越好;其他两个指标则是越小越好。 从图中可见,当Adjusted R2最大(0.55)时,选出的2个特征为:“Population”, “Illiteracy”
|
CopyRight 2018-2019 实验室设备网 版权所有 |