双样本T检验、F检验 | 您所在的位置:网站首页 › 方差齐性检验的原假设 › 双样本T检验、F检验 |
我认为T检验 和F检验在机器学习中的作用:判断机器学习中样本集中的某个特征(自变量)和因变量之间的相关性强弱(用于在建模中判断此自变量是否可以扔掉)
最近在做数据分析方面的工作,经常需要检验两组样本之间是否存在差异,所以会遇到统计学中假设检验相关的知识。在机器学习特征工程这一步,笔者最常用到的是假设检验中的卡方检验去做特征选择,因为卡方检验可以做两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。但是笔者今天想介绍一下通过T检验做机器学习中的特征工程,希望能够让大家初步了解到各种假设检验是如何在机器学习项目的特征工程发挥作用。 1、理论部分假设检验简介统计学中,常见的假设检验有:T检验(Student's t Test),F检验(方差齐性检验),卡方验证等。无论任何假设检验,它们都遵循如下图所示的流程: 做两个假设:一般如果假设对象是两组样本的话(一组数据集中有多个特征,选择其中的两个特征,就是指的这里说的两组样本),都会假设这两组样本(其实也就是指的是样本数据中的两个特征值)均值相等,(T检验的假设),方差满足齐次性(F检验的假设)等。而另一个假设其实就是两组样本均值不相等(T检验的假设),方差不满足齐次性(F检验的假设)等,其实这两个假设就是一对非此即彼的选项。这两个假设在教科书上就叫做原假设 |
CopyRight 2018-2019 实验室设备网 版权所有 |