CRF模型 | 您所在的位置:网站首页 › crf算法 › CRF模型 |
CRF概念 随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。 马尔科夫随机场是随机场的特例,它假设随机场中某一个位置的赋值仅仅与和它相邻的位置的赋值有关,和与其不相邻的位置的赋值无关。 CRF是马尔科夫随机场的特例,它假设马尔科夫随机场中只有X和Y两种变量,X一般是给定的,而Y一般是在给定X的条件下我们的输出。 X和Y有相同的结构的CRF就构成了线性链条件随机场。 CRF的数学语言描述:设X与Y是随机变量, linear-CRF的数学定义:设 linear-CRF模型:给定训练数据集X和对应的标记序列,K个特征函数 应用:条件概率 优化目标: 【注】使用了本人文章“最大熵模型”记录的一个结论。 得: 求导: 更新参数: 特征分为2类,第一类是定义在Y节点上的节点特征函数,这类特征函数只和当前节点有关,记为: 第二类是定义在Y上下文的局部特征函数,这类特征只和当前节点和上一节点有关,记为: 维特比解码: 维特比算法是一个动态规划算法
其中 参考:http://www.cnblogs.com/pinard/p/7048333.html HMM模型 HMM有2个假设:一阶马尔可夫假设,即任意时刻的状态只依赖前一时刻的状态,与其他时刻无关;观测独立性假设。任意时刻的观测只依赖于该时刻的状态,与其他状态无关。 学习联合概率
MEMM最大熵马尔可夫模型 有别于HMM,MEMM的当前状态依赖于前一状态与当前观测 学习条件概率 其中S代表状态集合,i代表当前被标记的位置; 可以注意到MEMM在每个节点对所有可能的状态y求和然后用做局部归一化的分母。所以MEMM中节点状态转移的概率都是归一化的概率。 缺点:标注偏置问题 从全局的角度分析: 无论观测值,State 1 总是更倾向于转移到State 2; 无论观测值,State 2 总是更倾向于转移到State 2. 可以看出MEMM所做的是本地归一化,导致有更少转移的状态拥有的转移概率普遍偏高,概率最大路径更容易出现转移少的状态。因MEMM存在着标注偏置问题,故全局归一化的CRF被提了出来。 HMM和CRF区别 1)HMM是生成式模型,CRF是判别式模型 https://www.cnblogs.com/hellochennan/p/6624509.html 两者都是用了马尔科夫链作为隐含变量的概率转移模型,只不过HMM使用隐含变量生成可观测状态,其生成概率有标注集统计得到,是一个生成模型;而CRF反过来通过可观测状态判别隐含变量,其概率亦通过标注集统计得来,是一个判别模型。 2)HMM是概率有向图,CRF是概率无向图 3)HMM求解过程可能是局部最优,CRF可以全局最优 4)CRF概率归一化较合理,HMM则会导致label bias 问题 5)CRF和HMM都假设隐变量是满足马尔科夫性的,即当前状态仅和上一个状态有概率转移关系而与其它位置的状态无关。 6)CRF优于HMM的地方在于,它可以引入更多的特征,包括词语本身特征和词语所在上下文的特征,而非单词本身。 https://www.zhihu.com/question/53458773 判别式模型:直接对 生成式模型:训练阶段对 完毕。 |
CopyRight 2018-2019 实验室设备网 版权所有 |