轻松搞定朴素贝叶斯(有例题) | 您所在的位置:网站首页 › 公式法十道例题 › 轻松搞定朴素贝叶斯(有例题) |
首先我们应该先弄清楚朴素贝叶斯是用来干什么的: 我们收集了大量不同质量苹果的大小、颜色、形状这三个苹果的特征信息后,如果这时又来了一个新的苹果,朴素贝叶斯就可以通过这个苹果的大小、颜色、形状判断这个苹果的质量 接下来我们会讲解公式,但是在讲解公式之前,为了大家便于理解,我们先说一下各个变量是什么: Y就是苹果的质量 X就是苹果的大小、颜色、形状这三个特征组成的向量;x1就代表苹果的大小,x2代表苹果的颜色,x3代表苹果的形状 朴素贝叶斯可以让我们通过一个苹果的特征向量,判断这个苹果的质量是怎么样的,即在已知苹果的大小、颜色、形状是怎么样的情况下求出这个苹果的质量,也就是P(Y|X) 下面我们结合实例理解朴素贝叶斯公式: 我们收集了10个不同质量苹果的特征信息:
朴素贝叶斯公式: 给定一个X(即已知这个苹果的大小、颜色、形状),我们就可以分别求出在这个X的前提下,这个苹果的质量是优或者差的概率,即P(Y=优|X)、P(Y=差|X),这两个概率哪个大,那么这个苹果的质量就是哪个。 结合公式进行一个具体的计算: 例:现在有一个大的、红色的、不规则的苹果,请问他是优的苹果还是差的苹果呢? 根据题意 X=大的、红色的、不规则的,即x1=大,x2=红色、x3=不规则 Y=优、差 我们要分别计算在x1=大,x2=红色、x3=不规则的情况下,Y=优、Y=差的概率 先看分子: P(Y=优)为这10个苹果中苹果为优的概率,看题目给出的表,很明显苹果为优的概率是4/10 P(x1=大|Y=优)为在苹果为优的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/4 P(x2=红|Y=优)为在苹果为优的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为4/4 P(x3=不规则|Y=优)为在苹果为优的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为1/4 再来看分母: 由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式: P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则) P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10 P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10 P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10 所以,P(Y=优|x1=大,x2=红,x3=不规则)=(4/10 * 3/4 * 4/4* 1/4) ÷ (6/10 * 5/10 * 5/10) = 1/2 同理,我们可以求P(Y=差|x1=大,x2=红,x3=不规则)
先看分子: P(Y=差)为这10个苹果中苹果为差的概率,看题目给出的表,很明显苹果为优的概率是6/10 P(x1=大|Y=差)为在苹果为差的前提下,苹果的大小是大的概率,根据题给的表,这个概率为3/6 P(x2=红|Y=差)为在苹果为差的前提下,苹果的颜色是红色的概率,根据题给的表,这个概率为1/6 P(x3=不规则|Y=差)为在苹果为差的前提下,苹果的形状是不规则的概率,根据题给的表,这个概率为4/6 再来看分母(其实和Y=优的情况下是一样的): 由于朴素贝叶斯假设特征向量X中的各个特征x是独立的,所以有下式: P(x1=大,x2=红,x3=不规则)=P(x1=大) * P(x2=红) * P * (x3=不规则) P(x1=大)为这10个苹果中苹果的大小为大的概率(只关注苹果的大小),根据题给的表,苹果为大的概率是6/10 P(x2=红)为这10个苹果中苹果颜色为红色的概率(只关注苹果的颜色),根据题给的表,苹果为红色的概率是5/10 P(x3=不规则)为这10个苹果中苹果形状为不规则的概率(只关注苹果的形状),根据题给的表,苹果为不规则的概率是5/10 所以,P(Y=差|x1=大,x2=红,x3=不规则)=(6/10 * 3/6 * 1/6* 4/6) ÷ (6/10 * 5/10 * 5/10) = 1/18 综上所述,在x1=大,x2=红,x3=不规则的前提下,Y=优的概率是1/2,Y=差的概率是1/18 即 P(Y=优|x1=大,x2=红,x3=不规则)=1/2 P(Y=差|x1=大,x2=红,x3=不规则)=1/18 而1/2大于1/18,即一个大的、红色的、不规则的苹果是优的概率大于是差的概率 所以,如果现在有一个大的、红色的、不规则的苹果,我们可以通过朴素贝叶斯判断这个苹果的质量应该是优 朴素贝叶斯的进阶理解 相信看了上面东西之后你已经完全理解朴素贝叶斯了,但上面的例子中,特征向量X只有三个特征大小(x1)、颜色(x2)、形状(x3),结果Y也只有优(y1)和差(y2)两个可能 接下来,我们假设特征向量X有m维,即X=(x1,x2,......,xm-1,xm) 结果Y有n维,即Y=(y1,y2,.........,yn-1,yn) P(Y=y1|X), P(Y=y2|X),.........,P(Y=yn|X)就是在给定X的情况下,Y=各个类的概率 给定X的意思就像上面例子中给定一个苹果,他的大小、颜色、形状都是给定的,分别为大、红、不规则 Y=各个类的概率就是在给定苹果的大小、颜色、形状的条件下,苹果的质量为优、差的概率 上图公式推导中的“?”代表这个特征的取值,还是拿苹果例子说明,如果X=(大、红、不规则),那么x1的?就是大,x2的?就是红,x3的?就是不规则。 苹果的特征向量只有三维,他没有x4,x5,x6........,他只有x1-x3,但是如果输入的是一副图像的HOG特征向量,他可能就会有x4,x5,x6...... 以上就是朴素贝叶斯理论的讲解了,代码(python)后续会出,有问题可以在评论区指出,谢谢大家。 |
CopyRight 2018-2019 实验室设备网 版权所有 |