利用R语言建立线性回归模型 | 您所在的位置:网站首页 › 湖南的旅游景点有哪些地方列入世界遗产名录 › 利用R语言建立线性回归模型 |
感谢评论区的人指出,我已经对这篇文章进行了修改,修改的内容为:- 增加了如何求回归模型中参数的置信区间 当当当,下面开始进入正题: 回归模型中最简单的是线性回归模型 在一般的统计学教材中,关于这部分会涉及很多公式,这里我们不谈这些,只谈一下,如何用R语言建立回归模型。 首先,说一下线性回归分析的步骤 先假设一个概率模型,这里,我们限定为直线模型 y=\beta_0+\beta_1x+\epsilon (其中,\beta_0 为直线截距,\beta_{1}为直线斜率,\epsilon为随机误差利用最小二乘法估计上述模型中的未知数。利用最小二乘法,可以得到一个误差平方和(SSE)比任何其他直线模型的SSE都小的模型 {\hat y} = \hat \beta_0+\hat \beta_1x指定随机误差分量{\epsilon} 的概率分布E(\epsilon) =0对所有的x值,Var(\epsilon) = \sigma^2为常数\epsilon 具有正态分布\epsilon 是独立的 尽管上述假定不一定完全满足,但一般我们近似认为满足,并用s^2=\frac{SSE}{n-2} 作为\sigma^2的一个无偏估计量,来代替\sigma^2 (这个值也称为均方误差或MSE)评价模型。包括检验斜率\beta_1 为0的原假设(t检验)、斜率的置信区间、计算相关系数(r)、决定系数(r^2)如果经过上述步骤,如果对模型比较满意,可以利用给定的x值估计y的均值E(y)或者给出y 的预测区间下面我以一道问题,来介绍在R中如何构建线性回归模型。 假定一家火灾保险公司想建立重大住宅火灾的火灾赔偿基金和住宅与最贱消防站距离的关系。结果如下表所示。试建立二者的线性回归模型。 (这里提个问题,欢迎在留言中回复哦。这个info是什么类型数据,另外,如何得到它的列标题? 然后,为了发现二者关系,我们利用plot函数先绘制出两变量间的散点图plot(info,col = 2)绘制的图像如下图所示 由图可以看出,这两个变量(距离 vs. 赔偿金额) 可能为线性关系,下面我们要进行线性拟合 在R中,线性拟合的函数为lm。它的具体用法是:lm(formula, data)结合本例子,解释一下常用 |
CopyRight 2018-2019 实验室设备网 版权所有 |