如何通俗理解线性回归? 您所在的位置:网站首页 回归啥意思 如何通俗理解线性回归?

如何通俗理解线性回归?

2023-01-22 08:23| 来源: 网络整理| 查看: 265

关注“金科应用研院”,回复“ZH”

领取风控资料合集

线性回归是在金融数据分析中很基础的机器学习算法,本文将通俗易懂的介绍线性回归的基本概念,优缺点和逻辑回归的比较。

首先回顾一下之前统计学习中比较重要的几个关键点:

---自变量和因变量

在统计学习的背景下,有两种类型的数据:

· 自变量:可以直接控制的数据。

· 因变量:无法直接控制的数据。

无法控制的数据,即因变量,需要进行预测或估计。

---模型

模型本质上就是一个转换引擎,主要的作用就是找到自变量和因变量之间的关系函数。

---参数

参数是添加到模型中用于输出预测的要素。

什么是线性回归?

线性回归的位置如上图所示,它属于机器学习 — 监督学习 — 回归 — 线性回归。

什么是回归?

回归是一种基于独立预测变量对目标值进行建模的方法。回归的目的主要是用于预测和找出变量之间的因果关系。比如预测明天的天气温度,预测股票的走势。回归之所以能预测是因为它通过历史数据,摸透了"套路",然后通过这个套路来预测未来的结果。

回归技术主要根据自变量的数量以及自变量和因变量之间的关系类型而有所不同。

什么是线性?

线性的意思是:数据点排成一条直线(或接近直线),或者沿直线延长。线性意味着,因变量和自变量之间的关系可以用直线表示。

"越…,越…"符合这种说法的就可能是线性关系:

「房子」越大,「租金」就越高

「金子」买的越多,花的「钱」就越多

杯子里的「水」越多,「重量」就越大

……

但是并非所有"越…,越…"都是线性的,比如"充电越久,电量越高",它就类似下面的非线性曲线:

线性关系不仅仅只能存在 2 个变量(二维平面)。3 个变量时(三维空间),线性关系就是一个平面,4 个变量时(四维空间),线性关系就是一个体。以此类推...

什么是线性回归?

线性回归本来是是统计学里的概念,现在经常被用在机器学习中。

线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x+e,e为误差服从均值为0的正态分布。

回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

如果 2 个或者多个变量之间存在"线性关系",那么我们就可以通过历史数据,摸清变量之间的"套路",建立一个有效的模型,来预测未来的变量结果。

线性回归的优缺点

优点:

建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快;可以根据系数给出每个变量的理解和解释。

缺点:

不能很好地拟合非线性数据。所以需要先判断变量之间是否是线性关系。

线性回归 VS 逻辑回归

线性回归和逻辑回归是 2 种经典的算法。经常被拿来做比较,下面整理了一些两者的区别:

线性回归只能用于回归问题,逻辑回归虽然名字叫回归,但是更多用于分类问题;线性回归要求因变量是连续性数值变量,而逻辑回归要求因变量是离散的变量;线性回归要求自变量和因变量呈线性关系,而逻辑回归不要求自变量和因变量呈线性关系;线性回归可以直观的表达自变量和因变量之间的关系,逻辑回归则无法表达变量之间的关系;

END

明白了线性回归的理论知识后,如何使用它来解决实际业务中的问题呢?

FAL经过大量行业调查和精心的设计后,为大家推出了一门“真”项目课程「金融数据分析师训练营」,项目案例真正贴合企业用工需求、且体系达到企业级、完全符合商用级上线应用标准,边做项目边学习,通过项目课程达到“一举多得”的学习效果。

报名听课

扫码添加科科微信免费咨询课程,职业规划

▶经验之谈:金融数据分析师如何做职业规划!

▶基于逻辑回归算法模型搭建思路

▶评分模型如何应用于决策

如果你喜欢这类型的干货类型的文章,可以把公众号设为星标 ,顺便转发让你的朋友知道,原来风控圈还有这样一个知识共享平台!

FAL长期对外征稿,邀请各大风控人士加入我们,在风控圈分享你的经验与知识 这是一篇征稿启事

点击阅读原文,和1000+位风控人一起成长!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有