【9.0】 数学建模 您所在的位置:网站首页 简述多元回归模型的整体显著性检验决策规则有哪些 【9.0】 数学建模

【9.0】 数学建模

2024-07-11 04:09| 来源: 网络整理| 查看: 265

一、前言

回归分析时数据分析中最基础也是最重要的工具,绝大多数的数据分析问题,都可以使用回归的思想来解决。回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归和生存回归,其划分的依据是因变量Y类型。这里主要学习线性回归。

1.1 回归分析的任务 任务一:回归分析要去识别并判断:哪些X变量是同Y真的相关,哪些不是。统计学中有一个非常重要的领域,叫做“变量选择”。(逐步回归法)任务二:去除了那些同Y不相关的X变量,那么剩下的,就都是重要的、有用的X变量了。接下来回归分析要回答的问题是:这些有用的X变量同Y的相关关系是正的呢,还是负的?任务三:在确定了重要的X变量的前提下,我们还想赋予不同X不同的权重,也就是不同的回归系数,进而我们可以知道不同变量之间的相对重要性。 1.2 回归的分类

在这里插入图片描述

1.3 数据的分类 横截面数据:在某一时间点收集的不同对象的数据,例如我们自己发放问卷得到的数据、全国各省份2018年GDP的数据、大一新生今年体测的得到的数据时间序列数据:对同一对象在不同时间连续观察所取得的数据,例如从出生到现在,你的体重的数据(每年生日称一次)、中国历年来GDP的数据、在某地方每隔一小时测得的温度数据面板数据:对同一对象在不同时间连续观察所取得的数据(多个对象,多个时间点),例如2008‐2018年,我国各省份GDP的数据 1.4 不同数据类型的处理方法

在这里插入图片描述 说明:

建模比赛中,前两种数据类型最常考到;面板数据较为复杂,是经管类学生在中级计量经济学中才会学到的模型横截面数据往往可以使用回归来进行建模,我们通过回归可以得到自变量与因变量之间的相关关系以及自变量的重要程度时间序列数据往往需要进行我们进行预测,时间序列模型的选择也很多,大家需要选择合适的模型对数据进行建模 二、一元线性回归

在这里插入图片描述 提醒:使用线性回归模型进行建模前,需要对数据进行预处理,用MATLAB、Excel、state等软件都可以

2.1 内生性的分析

在这里插入图片描述

说明:如果误差项 μ \mu μ含有与已经添加的自变量相关的变量,且该变量和因变量 y y y相关,则存在内生性(简单来说就是在进行回归分析的时候遗漏了变量)

2.2 核心解释变量和控制变量

无内生性要求所有解释变量均与扰动项不相关。这个假定通常太强,因为解释变量一般很多(比如,5‐15个解释变量),且需要保证它们全部外生。是否可能弱化此条件?答案是肯定的,如果你的解释变量可以区分为核心解释变量与控制变量两类。

核心解释变量:我们最感兴趣的变量,因此我们特别希望得到对其系数的一致估计(当样本容量无限增大时,收敛于待估计参数的真值)控制变量:我们可能对于这些变量本身并无太大兴趣;而之所以把它们也放入回归方程,主要是为了“控制住” 那些对被解释变量有影响的遗漏因素 在这里插入图片描述 2.3 何时取对数

取对数意味着原被解释变量对解释变量的弹性,即百分比的变化而不是数值的变化

目前,对于什么时候取对数还没有固定的规则,但是有一些经验法则:

与市场价值相关的,例如,价格、销售额、工资等都可以取对数以年度量的变量,如受教育年限、工作经历等通常不取对数比例变量,如失业率、参与率等,两者均可变量取值必须是非负数,如果包含0,则可以对y取对数ln(1+y)

取对数的好处:

减弱数据的异方差性如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布模型形式的需要,让模型具有经济学意义 2.4 四类模型回归系数的解释 一元线性回归 : 𝑦 = 𝑎 + 𝑏𝑥 + 𝜇,x每增加1个单位,y平均变化b个单位 在这里插入图片描述双对数模型 : 𝑙𝑛𝑦 = 𝑎 + 𝑏𝑙𝑛𝑥 + 𝜇,x每增加1%,y平均变化b% 在这里插入图片描述半对数模型 : 𝑦 = 𝑎 + 𝑏𝑙𝑛𝑥 + 𝜇,x每增加1%,y平均变化b/100个单位 在这里插入图片描述半对数模型:𝑙𝑛𝑦 =𝑎 +𝑏𝑥 + 𝜇,x每增加1个单位,y平均变化(100b)% 在这里插入图片描述 2.5 虚拟变量X的设置

如果自变量中有定性变量,例如性别、地域等,就需要在回归中设置虚拟变量,同时为了避免多重共线性的影响,引入的虚拟变量的个数一般是分类数减去1 在这里插入图片描述

三、示例 3.1 普通最小二乘估计法OSL

题目:

现有某电商平台846条关于婴幼儿奶粉的销售信息,每条信息由11个指标组成。其中,评价量可以从一个侧面反映顾客对产品的关注度。请对所给数据进行以下方面的分析,要求最终的分析将不仅仅有益于商家,更有益于宝妈们为宝贝选择适合自己的奶粉。

以评价量为因变量,分析其它变量和评价量之间的关系;以评价量为因变量,研究影响评价量的重要因素。

数据(关注公众号,回复“多元回归即可获取”) 在这里插入图片描述 数据描述性统计的结果(自己用state软件生成,然后用Excel制作) 在这里插入图片描述 代码:

// import excel "C:\Users\hc_lzp\Desktop\数学建模视频录制\第7讲.多元回归分析\代码和例题数据\课堂中讲解的奶粉数据.xlsx", sheet("Sheet1") firstrow import excel "课堂中讲解的奶粉数据.xlsx", sheet("Sheet1") firstrow // 定量变量的描述性统计 summarize 团购价元 评价量 商品毛重kg // 定性变量的频数分布,并得到相应字母开头的虚拟变量 tabulate 配方,gen(A) tabulate 奶源产地 ,gen(B) tabulate 国产或进口 ,gen(C) tabulate 适用年龄岁 ,gen(D) tabulate 包装单位 ,gen(E) tabulate 分类 ,gen(F) tabulate 段位 ,gen(G)

state回归的语句

regress 评价量 团购价元 商品毛重kg // 下面的语句可帮助我们把回归结果保存在Word文档中 // 在使用之前需要运行下面这个代码来安装下这个功能包(运行一次之后就可以注释掉了) // ssc install reg2docx, all replace // 如果安装出现connection timed out的错误,可以尝试换成手机热点联网,如果手机热点也不能下载,就不用这个命令吧,可以自己做一个回归结果表,如果觉得麻烦就直接把回归结果截图。 est store m1 reg2docx m1 using m1.docx, replace // *** p


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有