轻松搞定朴素贝叶斯(有例题) 您所在的位置:网站首页 公式法十道例题 轻松搞定朴素贝叶斯(有例题)

轻松搞定朴素贝叶斯(有例题)

2024-07-05 06:25| 来源: 网络整理| 查看: 265

首先我们应该先弄清楚朴素贝叶斯是用来干什么的:

我们收集了大量不同质量苹果的大小、颜色、形状这三个苹果的特征信息后,如果这时又来了一个新的苹果,朴素贝叶斯就可以通过这个苹果的大小、颜色、形状判断这个苹果的质量

接下来我们会讲解公式,但是在讲解公式之前,为了大家便于理解,我们先说一下各个变量是什么:

Y就是苹果的质量

X就是苹果的大小、颜色、形状这三个特征组成的向量;x1就代表苹果的大小,x2代表苹果的颜色,x3代表苹果的形状

朴素贝叶斯可以让我们通过一个苹果的特征向量,判断这个苹果的质量是怎么样的,即在已知苹果的大小、颜色、形状是怎么样的情况下求出这个苹果的质量,也就是P(Y|X)

下面我们结合实例理解朴素贝叶斯公式:

我们收集了10个不同质量苹果的特征信息:

 朴素贝叶斯公式:

给定一个X(即已知这个苹果的大小、颜色、形状),我们就可以分别求出在这个X的前提下,这个苹果的质量是优或者差的概率,即P(Y=优|X)、P(Y=差|X),这两个概率哪个大,那么这个苹果的质量就是哪个。

结合公式进行一个具体的计算: 

例:现在有一个大的、红色的、不规则的苹果,请问他是优的苹果还是差的苹果呢?

根据题意

X=大的、红色的、不规则的,即x1=大,x2=红色、x3=不规则

Y=优、差

我们要分别计算在x1=大,x2=红色、x3=不规则的情况下,Y=优、Y=差的概率

先看分子: 

P(Y=优)为这10个苹果中苹果为优的概率,看题目给出的表,很明显苹果为优的概率是4/10

P(x1=大|Y=优)为在苹果为优的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/4

P(x2=红|Y=优)为在苹果为优的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为4/4

P(x3=不规则|Y=优)为在苹果为优的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为1/4

再来看分母:

由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式:

P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)

P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10

P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10

P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10

所以,P(Y=优|x1=大,x2=红,x3=不规则)=(4/10 * 3/4 * 4/4* 1/4) ÷ (6/10 * 5/10 * 5/10) = 1/2

同理,我们可以求P(Y=差|x1=大,x2=红,x3=不规则)

 

先看分子: 

P(Y=差)为这10个苹果中苹果为差的概率,看题目给出的表,很明显苹果为优的概率是6/10

P(x1=大|Y=差)为在苹果为差的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/6

P(x2=红|Y=差)为在苹果为差的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为1/6

P(x3=不规则|Y=差)为在苹果为差的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为4/6

再来看分母(其实和Y=优的情况下是一样的):

由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式:

P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则)

P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10

P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10

P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10

所以,P(Y=差|x1=大,x2=红,x3=不规则)=(6/10 * 3/6 * 1/6* 4/6) ÷ (6/10 * 5/10 * 5/10) = 1/18

综上所述,在x1=大,x2=红,x3=不规则的前提下,Y=优的概率是1/2,Y=差的概率是1/18

P(Y=优|x1=大,x2=红,x3=不规则)=1/2

P(Y=差|x1=大,x2=红,x3=不规则)=1/18

而1/2大于1/18,即一个大的、红色的、不规则的苹果是优的概率大于是差的概率

所以,如果现在有一个大的、红色的、不规则的苹果,我们可以通过朴素贝叶斯判断这个苹果的质量应该是优

朴素贝叶斯的进阶理解

相信看了上面东西之后你已经完全理解朴素贝叶斯了,但上面的例子中,特征向量X只有三个特征大小(x1)、颜色(x2)、形状(x3),结果Y也只有优(y1)和差(y2)两个可能

接下来,我们假设特征向量X有m维,即X=(x1,x2,......,xm-1,xm)

结果Y有n维,即Y=(y1,y2,.........,yn-1,yn)

P(Y=y1|X), P(Y=y2|X),.........,P(Y=yn|X)就是在给定X的情况下,Y=各个类的概率

给定X的意思就像上面例子中给定一个苹果,他的大小、颜色、形状都是给定的,分别为大、红、不规则

Y=各个类的概率就是在给定苹果的大小、颜色、形状的条件下,苹果的质量为优、差的概率

上图公式推导中的“?”代表这个特征的取值,还是拿苹果例子说明,如果X=(大、红、不规则),那么x1的?就是大,x2的?就是红,x3的?就是不规则。

苹果的特征向量只有三维,他没有x4,x5,x6........,他只有x1-x3,但是如果输入的是一副图像的HOG特征向量,他可能就会有x4,x5,x6......

以上就是朴素贝叶斯理论的讲解了,代码(python)后续会出,有问题可以在评论区指出,谢谢大家。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有