R语言机器学习(1) | 您所在的位置:网站首页 › r语言实验报告怎么写 › R语言机器学习(1) |
转载请注明出处:https://blog.csdn.net/xiezhiliang22 对应书籍:《R数据挖掘》薛薇 中国人民大学出版社 1 前言下面这几个部分主要讲述如何使用R语言来实现几个经典的机器学习以及统计学之中的算法,在这里原理部分就一带而过,如果想要学习的话可以参考其他博主。这里主要介绍如何直接上手使用几个经典算法。 2 K近邻原理数学原理:简单来说就是基于已经给定的样本数据,通过各种各样的数学定义距离,这个新加入的点靠哪一个近,就属于那一类。 误差评估: (1)旁置法————样本集合比较多的情况,分为2个集合分别为训练集合测试集 (2)留一法————样本集合比较少的情况,比如有n个样本,抽取出来一个作为测试集,重复n次计算误差率 适用范围:低维度的分类问题,高维度不太适用 3 R应用函数注意:先下载class包 (1)特征选择 选择对分类结果影响比较大的结果,可以使用数理统计之中的方法来做相关性检验看变量与其的影响因子之间有没相关性,可以使用相关分析,方差分析,卡方检验等等 此外还有选取不同的特征会导致有不同的误差,误差下降率越大说明这个特征选择越强 (2)基于变量重要性的加权K近邻法 这里有点类似于神经网络之中的权重影响对于最终结果的影响 公式: |
CopyRight 2018-2019 实验室设备网 版权所有 |