机器学习分类之“监督式学习”和“非监督式学习”,全网讲的最简单最明白 您所在的位置:网站首页 用python做预测 机器学习分类之“监督式学习”和“非监督式学习”,全网讲的最简单最明白

机器学习分类之“监督式学习”和“非监督式学习”,全网讲的最简单最明白

2023-04-05 12:08| 来源: 网络整理| 查看: 265

根据输入数据是否具有“响应变量”信息,机器学习被分为“监督式学习”和“非监督式学习”。“监督式学习”即输入数据中即有X变量,也有y变量,特色在于使用“特征(X变量)”来预测“响应变量(y变量)”。如果响应变量(y变量)为分类变量,比如信贷资产五级分类(正常、关注、次级、可疑、损失)或客户信用评级(AAA, AA……, C, D),则又可以进一步称为“分类问题监督式学习”;如果响应变量(y变量)为连续变量,比如计算客户最大债务承受额,则又可以进一步称为“回归问题监督式学习”。“非监督式学习”即算法在训练模型时期不对结果进行标记,而是直接在数据点之间找有意义的关系,或者说输入数据中仅有X变量而没有y变量,特色在于针对X变量进行降维或者聚类,以挖掘特征变量的自身特征。“监督式学习”和“非监督式学习”只是常见的机器学习分类,除了这两种之外,还有半监督式学习、强化学习等学习方式。

《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)

“监督式学习”的模型优劣及应用场景很好理解。模型优劣评价方面,输入x变量值后,通过机器学习算法构建模型得到y变量拟合值,将它与y变量实际值进行对比,即可检验模型的优劣。其中针对“回归问题监督式学习”,比较的是y变量拟合值与实际值的数量差异;针对“分类问题监督式学习”,则比较的是y变量拟合的分类和实际的分类。应用场景方面,比如根据目标客户的基本信息、交易信息等特征,预测客户的价值贡献度(回归问题)、是否购买新产品(分类问题),进而制定针对性的市场营销策略;又比如根据目标客户的基本信息、财务信息、负债及对外担保信息等预测违约概率(回归问题)、进行信用评级(分类问题),进而制定针对性的风险防控策略。 “非监督式学习”由于目标不明确,所以其效果很难评估,它的价值在于发现模式以及相关性。如果从特征(变量)的角度来看,价值体现在对变量进行降维,从而有助于解释变量之间的关系或降低模型的复杂程度;如果从样本的角度来看,价值体现在可以研究个体之间的关系,将相近的个体划分在一起。比如可以用于商业银行的反洗钱领域或员工行为管理,通过“非监督式学习”把行为或个体快速进行分类,即使我们可能无法清楚地知晓分类意味着什么,但是可以快速区分出正常或异常的行为或个体组,从而为深入分析做好准备,显著提升分析效率。又比如在搜索引擎中,我们基于用户特征把用户快速聚类,可精准实施广告投放或偏好信息推送。再比如在电商平台中,系统针对具有相似购买行为的用户推荐合适的产品,A用户和B用户为同一类,若A用户购买了某产品,则B用户大概率也会购买该产品,可将该产品推送给B用户,实现精准推荐等。

以上内容节选自《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)一书“3.3 机器学习分类”。

Python、机器学习听起来很难,能学会吗?--推荐一本避雷避坑、已经被亲测可行的网红书《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)。这本书内容非常详实,包含了Python学习和机器学习算法原理,相当于一次获得了两本书,同时详解Python学习和机器学习算法的问题。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。

《Python机器学习原理与算法实现》一书创作完成后,在正式出版之前,已经开发成一套系统课程,分9次授课,在某全国性股份制商业银行内部开展了培训,490人根据行内组织统一学习,授课完成后放在知鸟平台供回放学习,9次课程累计回放量近3万次,得到参训学员的一致好评,广泛应用于各位学员的工作实践。(所以,几乎没有太大难度,只要用心学,都没问题哦)

这本书在机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有12小时的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。

《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社)

本书特色通过“入门进阶应用”循序渐进的方式讲解Python。前两章分别讲解Python入门知识和Python进阶知识,使大家能够基本掌握Python的基础知识与进阶应用,后续章节在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释,使读者能够真正理解各种代码的含义,从而可以灵活运用于自身的科研或应用研究。通过“复杂算法模型简单化、抽样理论概念具象化”深入浅出的方式讲解机器学习。本书尽可能用图像化、案例化的方式剖析各种算法的基本原理、适用条件,使读者真的能够看得明白、学得进去,避免在复杂的数学公式推导面前耗尽了所有的学习热情,苦技能虽好却不能为己所用。同时也做到了不失专业深度,使读者真正能够掌握各种算法的精髓,能根据自身需要选取算法、优化代码、科学调参。实现了Python与机器学习应用的深度融合。本书以学以致用为桥梁实现了Python与机器学习之间的高效联动协同,使读者通过本书的学习能够同时掌握Python语言、机器学习这两大专业利器,达到“一箭双雕”的学习效果,有效提升自己的科研与应用水平。

《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社)

创作不易,恳请各位朋友多多点赞支持,真诚感谢!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有