用身高和体重数据进行分类实验 | 您所在的位置:网站首页 › 美国女人身高数据 › 用身高和体重数据进行分类实验 |
用身高和体重数据进行性别分类的实验报告
一、基本要求 :
1 .
用 FAMALE.TXT 和 MALE.TXT 的数据作为训练样本集,建立 Bayes 分类器, 用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素, 考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。
二、具体做法:
( 1 )应用单个特征进行实验:以( a )身高或者( b )体重数据作为特征,在正态 分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率 Bayes 分类器,写出得到的决策规则,将该分类器应用到测试样本,考察测试错误 情况。在分类器设计时可以考察采用不同先验概率(如 0.5 对 0.5, 0.75 对 0.25, 0.9 对 0.1 等)进行实验,考察对决策规则和错误率的影响。
( 2 )应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者 相关或不相关,在正态分布假设下估计概率密度,建立最小错误率 Bayes 分类器, 写出得到的决策规则,将该分类器应用到训练 / 测试样本,考察训练 / 测试错误情 况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同 先验概率(如 0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)进行实验,考察对 决策和错误率的影响。
( 3 )自行给出一个决策表,采用最小风险的 Bayes 决策重复上面的某个或全部实 验。
三、原理简述及程序框图
最小错误率 Bayes 分类器
( 1 )基于身高
第一步
求出训练样本的方差和期望
第二步
利用单变量正态分布公式算出条件概率
第三步
将前两步的值带入贝叶斯公式
第四步
若 pF>=pM ,则判断其为第一类,反之,第二类
|
CopyRight 2018-2019 实验室设备网 版权所有 |