朴素贝叶斯算法的后延概率最大化的认识与理解

您所在的位置:网站首页 在贝叶斯定理的应用过程中,先验概率如何计算 朴素贝叶斯算法的后延概率最大化的认识与理解

朴素贝叶斯算法的后延概率最大化的认识与理解

2024-07-16 03:45:00| 来源: 网络整理| 查看: 265

朴素贝叶斯算法的后延概率最大化的认识与理解 2017-11-30 2602 分享海报

电子常识

2131人已加入 描述

  朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。

  和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。

  模型讲解

  条件概率分布的参数数量是指数级的,也就是X和Y的组合很多,造成维数灾难,导致实际无法运算。此处,朴素贝叶斯法对它做了条件独立性的假设:

  朴素贝叶斯算法的后延概率最大化的认识与理解

  也就是各个维度的特征在类确定的情况下都是独立分布的。这一假设简化了计算,也牺牲了一定的分类准确率。基于此假设,以及贝叶斯定理,后验概率为:

  朴素贝叶斯算法的后延概率最大化的认识与理解

  分母其实是P(X=x),等同于枚举ck求联合分布的和:∑P(X=x,Y=ck),此联合分布按公式:

  朴素贝叶斯算法的后延概率最大化的认识与理解

  拆开,等于上式分母。将独立性假设代入上式,得到:

  朴素贝叶斯算法的后延概率最大化的认识与理解

  朴素贝叶斯分类器可以表示为:

  朴素贝叶斯算法matlab实现以及EM算法

  也就是给定参数,找一个概率最大的ck出来。注意到上式分母其实就是P(X=x),x给定了就固定了,跟ck一点关系都没有,所以分母可以去掉,得到:

  朴素贝叶斯算法matlab实现以及EM算法

  后验概率最大化等价于期望风险最小化。如下解释

  选择0-1损失函数,如下:

  朴素贝叶斯算法matlab实现以及EM算法

  f(X)就是分类器的决策函数,损失函数的参数其实是一个联合分布。此时期望风险函数为:

  朴素贝叶斯算法matlab实现以及EM算法

  上面说过,这是一个联合分布P(X,Y),是一个and(连乘)的形式,由此取条件期望为风险函数:

  朴素贝叶斯算法matlab实现以及EM算法

  所谓条件期望,就是指X=x时,Y的期望。上式其实可以这么推回去:Ex∑[L()]P(ck|X)=∑P(X)∑[L()]P(X,ck)/P(X)=∑[L()]P(X,ck)=E[L()],格式比较乱,但愿意思到了。为了最小化上式,只需对每个X=x执行最小化,那么加起来肯定是极小化的,由此有:

  朴素贝叶斯算法matlab实现以及EM算法

  参数估计

  极大似然估计:

  前面说过,朴素贝叶斯法要学习的东西就是P(Y=ck)和P(X=x|Y=ck),这两个概率的估计用极大似然估计法(简单讲,就是用样本猜测模型参数,或者说使得似然函数最大的参数)进行:

  朴素贝叶斯算法matlab实现以及EM算法

  也就是用样本中ck的出现次数除以样本容量:

  朴素贝叶斯算法matlab实现以及EM算法

  分子是样本中变量组合的出现次数,分母是上面说过的样本中ck的出现次数。

  贝叶斯估计:

  最大似然估计有个隐患,假设训练数据中没有出现某种参数和类别的组合怎么办?此时估计的概率值为0,但是这不代表真实数据中就没有这样的组合。解决办法是采用贝叶斯估计,以下显示的是先验概率的贝叶斯估计和条件概率的贝叶斯估计:

  朴素贝叶斯算法matlab实现以及EM算法

  分子和分母分别比最大似然估计多了一点东西,其意义是在随机变量每个取值的频数上加一个常量,当此常量取0时,就是最大似然估计,当此常量取1时,称为拉普拉斯平滑,常用来解决零概率的问题。

  算法流程

  总结如下算法流程:

  朴素贝叶斯算法的后延概率最大化的认识与理解

打开APP阅读更多精彩内容


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭