支持向量机(SVM)前戏

您所在的位置:网站首页 平面向量简单例题 支持向量机(SVM)前戏

支持向量机(SVM)前戏

2024-07-01 16:25:35| 来源: 网络整理| 查看: 265

问题:训练集有3个数据点,其中两个正例点: x 1 = ( 3 , 3 ) T , x 2 = ( 4 , 3 ) T , 一 个 负 例 点 : x 3 = ( 1 , 1 ) T x_1=(3,3)^T,x_2=(4,3)^T,一个负例点:x_3=(1,1)^T x1​=(3,3)T,x2​=(4,3)T,一个负例点:x3​=(1,1)T。试求最大间隔分离超平面(在二维空间即为一条直线)。

构建模型:设超平面方程为 w 1 x + w 2 y + b = 0 w_1x+w_2y+b=0 w1​x+w2​y+b=0,则上述问题等价于下列约束最优化问题: m i n w i , b , i = 1 , 2 1 2 ( w 1 2 + w 2 2 ) \underset{w_i,b,i=1,2}{min} \frac{1}{2}(w_1^2+w_2^2) wi​,b,i=1,2min​21​(w12​+w22​) s.t. 3 w 1 + 3 w 2 + b > = 1 3w_1+3w_2+b>=1 3w1​+3w2​+b>=1 4 w 1 + 3 w 2 + b > = 1 4w_1+3w_2+b>=1 4w1​+3w2​+b>=1 − w 1 − w 2 − b > = 1 -w_1-w_2-b>=1 −w1​−w2​−b>=1

1,代数解法

构建拉格朗日函数: L ( w 1 , w 2 , b , μ 1 , μ 2 , μ 3 ) = 1 2 ( w 1 2 + w 2 2 ) + μ 1 ( 1 − 3 w 1 − 3 w 2 − b ) + μ 2 ( 1 − 4 w 1 − 3 w 2 − b ) + μ 3 ( w 1 + w 2 + b + 1 ) \mathcal{L}(w_1,w_2,b,\mu_1,\mu_2,\mu_3)=\frac{1}{2}(w_1^2+w_2^2)+\mu_1(1-3w_1-3w_2-b)+\mu_2(1-4w_1-3w_2-b)+\mu_3(w_1+w_2+b+1) L(w1​,w2​,b,μ1​,μ2​,μ3​)=21​(w12​+w22​)+μ1​(1−3w1​−3w2​−b)+μ2​(1−4w1​−3w2​−b)+μ3​(w1​+w2​+b+1)

求偏微分: ∂ L ∂ w 1 = w 1 − 3 μ 1 − 4 μ 2 + μ 3 = 0 \frac{\partial\mathcal{L}}{\partial w_1}=w_1-3\mu_1-4\mu_2+\mu_3=0 ∂w1​∂L​=w1​−3μ1​−4μ2​+μ3​=0 ∂ L ∂ w 2 = w 2 − 3 μ 1 − 3 μ 2 + μ 3 = 0 \frac{\partial\mathcal{L}}{\partial w_2}=w_2-3\mu_1-3\mu_2+\mu_3=0 ∂w2​∂L​=w2​−3μ1​−3μ2​+μ3​=0 ∂ L ∂ b = − μ 1 − μ 2 + μ 3 = 0 \frac{\partial\mathcal{L}}{\partial b}=-\mu_1-\mu_2+\mu_3=0 ∂b∂L​=−μ1​−μ2​+μ3​=0 用KKT条件对其进行约束: 3 w 1 + 3 w 2 + b − 1 > = 0 3w_1+3w_2+b-1>=0 3w1​+3w2​+b−1>=0 4 w 1 + 3 w 2 + b − 1 > = 0 4w_1+3w_2+b-1>=0 4w1​+3w2​+b−1>=0 − w 1 − w 2 − b − 1 > = 0 -w_1-w_2-b-1>=0 −w1​−w2​−b−1>=0 μ i > = 0 , i = 1 , 2 , 3 \mu_i>=0,i=1,2,3 μi​>=0,i=1,2,3 μ 1 ( 3 w 1 + 3 w 2 + b − 1 ) = 0 \mu_1(3w_1+3w_2+b-1)=0 μ1​(3w1​+3w2​+b−1)=0 μ 2 ( 4 w 1 + 3 w 2 + b − 1 ) = 0 \mu_2(4w_1+3w_2+b-1)=0 μ2​(4w1​+3w2​+b−1)=0 μ 3 ( − w 1 − w 2 − b − 1 ) = 0 \mu_3(-w_1-w_2-b-1)=0 μ3​(−w1​−w2​−b−1)=0 分情况进行讨论: 1)假设 μ 1 = 0 , 可 以 计 算 得 w 1 = 3 μ 2 , w 2 = 2 μ 2 , 带 入 三 个 不 等 式 得 : b > = 1 − 15 μ 2 , b > = 1 − 18 μ 2 , b < = − 5 μ 2 − 1 \mu_1=0,可以计算得w_1=3\mu_2,w_2=2\mu_2,带入三个不等式得:b>=1-15\mu_2,b>=1-18\mu_2,b=1−15μ2​,b>=1−18μ2​,b = 1 / 5 , 则 4 w 1 + 3 w 2 + b − 1 = 0 , − w 1 − w 2 − b − 1 = 0 , 即 18 μ 2 + b − 1 = 0 , − 5 μ 2 − b − 1 = 0 , 即 μ 2 = 2 / 13 , 矛 盾 , 所 以 μ 1 大 于 0 \mu_2=\mu_3>=1/5,则4w_1+3w_2+b-1=0,-w_1-w_2-b-1=0,即18\mu_2+b-1=0,-5\mu_2-b-1=0,即\mu_2=2/13,矛盾,所以\mu_1大于0 μ2​=μ3​>=1/5,则4w1​+3w2​+b−1=0,−w1​−w2​−b−1=0,即18μ2​+b−1=0,−5μ2​−b−1=0,即μ2​=2/13,矛盾,所以μ1​大于0。

2)假设 μ 2 = 0 , 可 以 计 算 得 w 1 = w 2 = 2 μ 1 > 0 , 带 入 三 个 不 等 式 ( 有 两 个 已 经 变 成 了 等 式 ) 得 : b = 1 − 12 μ 1 , b > = 1 − 14 μ 1 , b = − 4 μ 1 − 1 \mu_2=0,可以计算得w_1=w_2=2\mu_1>0,带入三个不等式(有两个已经变成了等式)得:b=1-12\mu_1,b>=1-14\mu_1,b=-4\mu_1-1 μ2​=0,可以计算得w1​=w2​=2μ1​>0,带入三个不等式(有两个已经变成了等式)得:b=1−12μ1​,b>=1−14μ1​,b=−4μ1​−1。 此时 μ 2 = 0 , μ 1 = μ 3 = 1 / 4 , w 1 = w 2 = 1 / 2 , b = − 2 \mu_2=0,\mu_1=\mu_3=1/4,w_1=w_2=1/2,b=-2 μ2​=0,μ1​=μ3​=1/4,w1​=w2​=1/2,b=−2。

假设 μ 2 不 等 于 0 , 则 4 w 1 + 3 w 2 + b − 1 = 0 , 3 w 1 + 3 w 2 + b − 1 = 0 , 即 w 1 = 0 , 易 得 μ 3 = 0 , μ 2 = − μ 1 , 显 然 出 现 了 矛 盾 , 此 种 情 况 不 可 能 。 \mu_2不等于0,则4w_1+3w_2+b-1=0,3w_1+3w_2+b-1=0,即w_1=0,易得\mu_3=0,\mu_2=-\mu_1,显然出现了矛盾,此种情况不可能。 μ2​不等于0,则4w1​+3w2​+b−1=0,3w1​+3w2​+b−1=0,即w1​=0,易得μ3​=0,μ2​=−μ1​,显然出现了矛盾,此种情况不可能。

3)假设 μ 3 = 0 , 由 前 面 的 条 件 易 知 μ 1 = 0 , 出 现 了 矛 盾 \mu_3=0,由前面的条件易知\mu_1=0,出现了矛盾 μ3​=0,由前面的条件易知μ1​=0,出现了矛盾。

综上所述: μ 2 = 0 , μ 1 = μ 3 但 不 等 于 0 , 此 时 μ 2 = 0 , μ 1 = μ 3 = 1 / 4 , w 1 = w 2 = 1 / 2 , b = − 2 \mu_2=0,\mu_1=\mu_3但不等于0,此时\mu_2=0,\mu_1=\mu_3=1/4,w_1=w_2=1/2,b=-2 μ2​=0,μ1​=μ3​但不等于0,此时μ2​=0,μ1​=μ3​=1/4,w1​=w2​=1/2,b=−2。

所以超平面方程为 1 / 2 x + 1 / 2 y − 2 = 0 1/2x+1/2y-2=0 1/2x+1/2y−2=0。

Note:使得 μ i \mu_i μi​不等于0的点都是支持向量上的点,其他点并没有起到约束效果。对于求最小值,构造拉格朗日函数时,应该使约束条件的方向是g(x)=0,i=1,2,3 μi​>=0,i=1,2,3

可以简化为 m i n μ \underset{\mu}{min} μmin​ f ( μ 1 , μ 2 ) = 4 μ 1 2 + 13 2 μ 2 2 + 10 μ 1 μ 2 − 2 μ 1 − 2 μ 2 f(\mu_1,\mu_2)=4\mu_1^2+\frac{13}{2}\mu_2^2+10\mu_1\mu_2-2\mu_1-2\mu_2 f(μ1​,μ2​)=4μ12​+213​μ22​+10μ1​μ2​−2μ1​−2μ2​ 此方程的解与上述情况一样。



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭