中文事件抽取研究综述

2023-07-28 01:50| 来源: 网络整理| 查看: 265

中文事件抽取研究综述中文事件抽取研究综述摘要2 事件抽取任务定义2.1 公开评测事件抽取评估 2.2 框架表示事件抽取2.3 实例表示事件抽取 3 中文事件抽取技术方法3.1 基于模式匹配的方法3.2 基于机器学习的方法（1）基于特征工程的方法（2）基于神经网络的方法（3）弱监督的方法 3.3 中文事件抽取的方法参考文献

中文事件抽取研究综述

项威，王邦 ( 华中科技大学电子信息与通信学院，湖北武汉430074)

摘要

事件抽取是构建知识图谱的关键任务之一，也是当前自然语言处理的研究热点和难点问题。

事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息，对人们认知世界有着深远的意义，在信息检索、智能问答、情感分析等应用场景有着重要的意义和价值。

在公开国际测评和语料的推动下，事件抽取研究受到越来越多的学者关注，取得了许多的研究成果。

按照事件抽取任务定义，有：

预先定义结构化的事件表示框架的框架表示事件抽取和通过事件实例中触发词及事件元素进行聚类的实例表示事件抽取。

根据事件抽取方法的不同，可以分为：

基于模式匹配的方法基于机器学习的方法

中文事件抽取方法还要考虑中文语言特性问题。

自动内容抽取国际评测会议 Automatic content extraction, ACE

将事件定义为：

发生在某个特定时间点或时间段，某个特定地域范围内，由一个或者多个角色参与的一个或者多个动作组成的事情或者状态的改变。

早期的事件抽取任务采用基于模式匹配的方式，随着机器学习的兴起，采用特征工程和神经网络的方法进行事件抽取受到关注。中文事件抽取还存在中文语言特性方面的问题

本文首先简要介绍了事件抽取的研究意义，再从事件抽取的任务定义和技术方法两个维度全面阐述事件抽取工作。

2 事件抽取任务定义

事件抽取在相关公开测评和语料的推动下展开，不同的公开测评和语料关注的领域和事件粒度不同。

框架表示事件抽取任务是参照公开测评事件抽取任务，也称为限定域事件抽取。实例表示事件抽取是在没有预先定义结构化的事件表示框架下，通过事件实例的触发词和事件元素词用无监督方法聚类来进行的事件抽取任务，也称为开放域事件抽取 2.1 公开评测事件抽取

公开评测语料通常面向通用背景，没有特定的领域背景，如ACE仅仅对新闻语料中关注的33种常用事件类型进行了标注。

公开评测极大推动了事件抽取的研究和发展，但公开评测语料通常面向通用背景，没有特定的领域背景，如ACE仅对新闻语料中关注的33种常用事件类型进行了标注。

虽然有少量的特定领域事件抽取语料，如BioNLP生物医学领域语料等，但不能满足丰富多样的实际应用需求。同时公开评测语料还存在数据量级小、事件类型稀疏和语料时效性差等问题，目前最优性能也无法满足知识图谱构建等应用需求。

ACE认为事件是事物状态的改变或事情的发生，并将事件抽取任务定义为从非结构化的文本中识别并抽取事件信息并结构化表示，包括事件触发词、事件类型、事件元素、元素角色。

相关术语：

实体 entity事件提及 event mention：描述事件的短语或句子，包括事件触发词和事件元素。事件触发词 event trigger事件元素 event arguments元素角色 argument roles

在这里插入图片描述

ACE事件抽取任务通常分为：事件检测 & 元素识别

事件检测：通过识别文本中的事件触发词检测事件，并判断事件类型。

每种事件类型对应唯一的事件表示框架（如生活-出生类型事件表示框架为{人物，时间，地点}）

元素识别：根据事件表示框架判断文本中的实体是否为事件元素，并确定元素角色

ACE语料没有指定具体的领域和场景，主要来自新闻语料，包括新闻专线、广播新闻等6个来源，同时包含英语、汉语、西班牙语三种语言，由美国宾夕法尼亚大学等语言数据联盟 linguistic data consortium, LDC 标注。ACE定义了8种类型和33种子类型事件及其对应的表示框架。

事件抽取任务往往依赖于文本的命名实体识别、共指消解、关系抽取等自然语言处理任务结果，但其并不是事件抽取任务本身所关注的。

ACE数据集同时对实体及其类型、关系、共指等内容进行了标注，在ACE事件抽取任务中通常直接使用实体标注内容。ACE事件抽取任务通常采用以下标准评估正确性：

评估

ACE事件抽取任务通常采用以下标准评估正确性：

如果一个事件触发词的位置偏移和事件类型与标注内容匹配，则正确识别该事件触发词如果一个事件元素词的位置偏移和对应事件与标注内容匹配，则正确识别该事件元素如果一个事件元素词的位置偏移、对应事件及元素角色与标注内容匹配，则正确识别并分类该事件元素 2.2 框架表示事件抽取

通过自顶向下的方式，预先定义事件表示框架，包括事件类等等，然后制作相应的标注语料数据进行事件抽取。

Perroni等在2018年提出一种从新闻报道和社交媒体中抽取突发事件等框架表示，用于公共安全预警、政府组织决策支持等。文章定义了“洪水”、“风暴”、“火灾”等7种突发事件类型，并结合6何分析法（5W1H: Who, What, Where, When, Why, How）设计各类事件元素的表示框架。刘振[7]等在2018年提出了常见科技政策领域内的事件类型与对应的事件表示框架，帮助获取科研领域内有价值的信息，把握学科发展趋势。

框架表示事件抽取任务按照不同的领域背景和应用需求自由灵活地构建事件框架表示，解决了公开评测语料的事件类型稀疏，数据量级小等问题。

【优点】框架表示的事件类型可扩展性强，结合远程监督的方法可以自动生成大规模标注数据，提高语料的时效性。

【缺点】但事件的框架表示通常结构复杂，通用性差，不同的领域背景和实际应用需要不同的事件框架表示，这都需要耗费大量的人力劳动和时间，并且严重依赖领域专家系统。

==> 所以框架表示事件的标注语料虽然可以保证每种事件类型的数量，但大部分标注语料规模仍然较小。

在这里插入图片描述

框架某个类型的事件必定有一个表述的框架：如，死亡类型的事件：肯定有实施者、有受害者、有时间。。。故，可以用这样的框架来抽取信息：先有触发词识别出该事件类型是 “死亡”事件，然后用“死亡”事件的模版去找出对应的元素。Done！ 2.3 实例表示事件抽取

实例表示事件抽取可以面向不同领域背景和应用需求的事件，也可以面向通用领域的事件语料。通过自底向上的方式，利用文本的上下文语境、句法依存结构等信息，采用无监督的方法聚类事件类型和事件元素，自动发现新的事件实例，不需要人工制作标注数据。

例如，如果事件触发词具有相似的上下文语境，那么它们可能属于同类事件；如果事件元素与事件触发词具有类似的句法依存结构，那么它们可能具有相同的事件元素角色。

Huang等[9]在2016年提出一种自由事件抽取模型，适用于所有语料输入，利用符号特征和分布式语义自动生成输入语料的事件表示，检测事件并结构化表示。Zhou等[10]在2017年从推特中用无监督模型抽取有价值的新闻事件并结构化表示，文章假设相同的事件拥有相似的实体和词语，用无监督的方法抽取结构化事件信息。Yuan等[11]在2018年利用新闻语料中的实体和实体类型建立槽值对(slot-value) 来检测事件，相似的实体槽值对句子属于相同的事件类型，最后生成事件结构化的表示框架。

【缺点】由于语言的结构复杂性，实例表示事件抽取很难准确地获得语义信息，并且难以用统一的结构化标准表示，需要一定的人工方式加以辅助，其结果仍然很难应用到其他自然语言处理任务中。

在这里插入图片描述

实例表示事件抽取：

先把一些词取出来，然后将这些词聚类，注意，这里并未定义哪些词是哪一类，而是让它们自己寻找类别，和识别事件元素 3 中文事件抽取技术方法

事件抽取任务在方法上可以分为基于模式匹配的方法和基于机器学习的方法两大类。

基于模式匹配的方法：是在一些模式的指导下进行的某类事件的识别和抽取方法，在特定领域中表现出了良好的性能。基于机器学习的方法：将事件抽取建模成多分类任务，通过提取的特征进行分类完成事件抽取。中文事件抽取中还需考虑语言特性的问题，主要通过建立勘误表和序列标注方法来解决。 3.1 基于模式匹配的方法

基于模式匹配事件抽取主要分为有监督的模式匹配方法和弱监督的模式匹配方法两大类。

有监督的模式匹配方法依赖于人工标注语料进行事件模式学习。 Ellen[12]等在1993年通过建立触发词典和13中事件匹配模式进行事件识别与抽取，事件匹配模式主要利用事件元素初始描述和事件元素上下文语义进行构建，并开发了AutoSlog模式匹配事件抽取系统，在MUC语料上性能优异。Kim等在1995年引入了WordNet语义词典，利用语义框架和短语结构进行事件抽取弱监督的模式匹配方法只需对语料进行预分类或指定种子模式的少量人工标注工作，然后自动进行事件模式学习。 Ellen[14]等在1995年在AutoSlog基础上开发出AutoSlog-ST系统，不需要对语料中的所有事件元素进行标注，只需标注事件类型，然后利用预分类语料自动学习事件模式。姜吉发[15]在2005年提出一种领域通用事件模式匹配方法IEPAM，将事件抽取模式分为语义模式、触发模式、抽取模式，在MUC-7语料的飞行事故事件抽取中获得优异结果。

【优缺点】模式匹配事件抽取方法在领域事件抽取任务中性能优异，但模版的制作需要耗费大量人力和时间，且模版局限于领域背景，很难在通用领域事件抽取任务中应用。

3.2 基于机器学习的方法

基于机器学习的方法将事件抽取建模成分类任务，是目前的主流研究方向。

尤其是深度学习和神经网络，已经成为事件抽取的主要手段，全连接神经网络、卷积神经网络和循环神经网络都已经成功应用到事件抽取任务中。此外，弱监督的方法能够自动生成标注语料数据，缓解数据稀疏问题，也逐步应用到事件抽取任务中。

（1）基于特征工程的方法

传统的机器学习方法将事件抽取任务建模为多分类问题，提取文本的语义特征，然后输入分类器进行事件抽取。

Ahn[2]等在2006年率先将事件抽取分为4个阶段的多分类子任务，包括事件触发词分类：判断词语是否为事件触发词和事件类型 —— 利用词汇特征、字典特征、句法特征、实体特征，完成触发词分类子任务事件元素分类：判断实体词语是否为事件元素 —— 利用事件类型、触发词特征、实体特征、句法特征，完成事件元素分类子任务事件属性分类：判断事件属性事件共指消解：判断两个事件实例是否属于同一事件

【缺点】传统的机器学习事件抽取多分类方法中，各个阶段的子分类任务是相互独立的，导致误差从前面的环节向后面的环节传递，性能也因此逐级衰减，并且无法处理全局的依赖关系。

（2）基于神经网络的方法

事件抽取的机器学习传统方法不仅需要人工设计特征，而且需要借助外部的NLP工具抽取特征，并且部分语言和领域缺少相关的NLP工具。

在各种特征的抽取过程中会产生误差，造成误差的积累和传播。

【神经网络的方法将事件抽取建模成端到端的系统，使用包含丰富语言特征的词向量作为输入自动提取特征，不需要或者极少的依赖外部的NLP工具，避免了人工设计特征的繁琐工作。】

Chen等[23]在2015年提出基于动态多池化卷积神经网络的事件抽取方法，利用动态多池化方法学习出一个句子中包含的多个事件。Feng等[18]在2016年提出用双向长短期记忆网络进行事件检测，但没有探索事件元素等抽取方法。Nguyen[19]等在2016年利用双向LSTM抽取句子中的语义特征，然后联合句子结构特征同时抽取事件触发词和事件元素。（3）弱监督的方法

弱监督的事件抽取方法希望通过结构化知识库或者少量人工标注数据，自动生成大规模、高质量的标注数据。

Chen[24]等在2009年提出利用少量人工标注数据训练模型，在未标注数据上反复迭代自动扩充标注数据。Liu[16]等在2016年提出利用ACE语料数据训练模型，再结合FrameNet知识库扩充标注数据。Chen[9]等在2017年提出利用Freebase、Wikipedia、FrameNet等知识库等远程监督方法，自动生成大规模的标注数据进行事件抽取，并将其应用到金融领域的事件抽取问题中。 3.3 中文事件抽取的方法

中文语言特性问题主要来自中文词句意合特性，中文语言词语件没有显示间隔，而分词会带来明显的错误和误差。

Chen[24]等在2009年提出中文事件抽取触发词不一致问题，并将中文触发词分词不一致问题分为跨词语 (cross-word) 不一致和内词语 (inside-word) 不一致两种类型。

在这里插入图片描述

Chen提出两种方法解决触发词分词不一致的问题：

基于词语的触发词标注，通过在训练集上建立触发词的全局勘误表修正测试集中分词不一致的触发词；基于字符的触发词标注，将触发词检测转化为序列标注问题。

Zeng[20]等在2016年用不同的中文分词工具对ACE中文语料进行分词，结果显示至少有14%对触发词分词结果与语料标注不一致！！！【这个需要使用】

解决：

在Chen的字符序列标注方法的基础上，使用双向长短期记忆网络和条件随机场抽取句子特征，并结合卷积神经网络抽取上下文语义特征完成中文事件抽取

Lin[26]等认为序列标注模型中的字符区别于词语，无法准确表达句子的语义，提出将每个字符与上下文的若干字符组合生成多个候选触发词块，然后从候选触发词块中检测触发词。

【中文事件抽取问题】

中文事件抽取还存在比英文更加严重的数据稀疏问题。中文语言的复杂性和灵活性使得相同语义的词语有更多表达方式，即同一类型事件触发词可以用更多词语表达。=> 因此中文触发词数量要远多于英文，导致测试集中有更多在训练集中没有出现过的未知触发词。参考文献

［1］ DODDINGTON G Ｒ，MITCHELL A，PＲZYBOCKI M A，et al．The automatic content extraction ( ACE) program－tasks，data，and evaluation［C］//Proceedings of the 2004 international conference on language resources and evaluation．Lisbon，Portugal: European Language Ｒesources Association，2004: 837－840．

［2］ AHN D．The stages of event extraction［C］//Proceedings of the workshop on annotations and reasoning about time and events．Sydney，Australia: Association for Computational Linguistics，2006: 1－8．

［3］ AGUILAＲ J，BELLEＲ C，MCNAMEE P，e t al．A comparison of the events and relations across ace，ere， tac － kbp，and framenet annotation standards［C］//Proceedings of the second workshop on events: definition，detection，coreference，and representation．Baltimore，Maryland，USA: ACL，2014: 45－53．

［4］ SONG Z，BIES A，STＲASSEL S，et al． From light to rich ere: annotation of entities，relations，and events［C］/ /Proceedings of the 3rd workshop on events: definition，detection，coreference，and representation． Beijing，China: ACL，2015:89－98．

［5］ PETＲONI F，ＲAMAN N，NUGENT T，et al．An extensible event extraction system with cross － media event resolution［C］/ /Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery ＆ data mining．London，United Kingdom: ACM， 2018: 626－635．

［6］ YANG H，CHEN Y，LIU K，et al．DCFEE: a document－level Chinese financial event extraction system based on automatically labeled training data［C］/ /Proceedings of ACL 2018，system demonstrations．Melbourne，Australia: ACL，2018: 50－55．

［7］刘振．基于网络科技信息的事件抽取研究［J］．情报科学，2018， 36( 9) : 115－117．

［8］ CHEN Y，LIU S，ZHANG X， et al．Automatically labeled data generation for large scale event extraction［C］/ /Proceedings of the 55th ACL．Vancouver，Canada: ACL， 2017: 409－419．

［9］ HUANG L，CASSIDY T，FENG X， et al．Liberal event extraction and event schema induction［C］/ /Proceedings of the 54th ACL．Berlin，Germany: ACL， 2016: 258－268．

［10］ ZHOU D，ZHANG X，HE Y．Event extraction from Twitter using non－parametric Bayesian mixture model with word embeddings［C］/ /Proceedings of the 15th EACL． Valencia，Spain: ACL， 2017: 808－817．

［11］ YUAN Q，ＲEN X，HE W， et al．Open－schema event profiling for massive news corpora［C］/ /Proceedings of the 27th ACM international conference on information and knowledge management．Torino， Italy: ACM， 2018: 587－596．

［12］ＲILOFF E．Automatically constructing a dictionary for information extraction tasks［C］/ /Proceedings of the 11th national conference on artificial intelligence．Washington D C: AAAI，1993: 811－816．

［13］ KIM J T，MOLDOVAN D I．Acquisition of linguistic patterns for knowledge－based information extraction［J］．IEEE Transactions on Knowledge and Data Engineering，1995，7 ( 5) : 713－724．

［14］ＲILOFF E，SHOEN J．Automatically acquiring conceptual patterns without an annotated corpus［C］/ /Third workshop on very large corpora．Massachusetts，USA: ACL， 1995: 148－161．

［15］姜吉发．一种事件信息抽取模式获取方法［J］．计算机工程，2005， 31( 15) : 96－98．

［16］ LIU S，CHEN Y，HE S， et al．Leveraging framenet to improve automatic event detection［C］/ /Proceedings of the 54th ACL．Berlin，Germany: ACL， 2016: 2134－2143．

［17］ NGUYEN T H，GＲISHMAN Ｒ．Event detection and domain adaptation with convolutional neural networks［C］/ /Proceedings of the 53rd ACL and the 7th IJCNLP． Beijing，China: ACL， 2015: 365－371．

［18］ FENG X，QIN B，LIU T．A language－independent neural network for event detection［J］．Science China: Information Sciences，2018， 61( 9) : 092106．

［19］ NGUYEN T H，CHO K，GＲISHMAN Ｒ．Joint event extraction via recurrent neural networks［C］/ /Proceedings of the 2016 NAACL: human language technologies．San Diego，California: ACL， 2016: 300－309．

［20］ ZENG Y，YANG H，FENG Y，et al．A convolution BiLSTM neural network model for Chinese event extraction［M］/ /Natural language understanding and intelligent applications．［s．l．］: Springer， 2016: 275－287．

［21］ LI P，ZHU Q，ZHOU G．Joint modeling of argument identification and role determination in Chinese event extraction with discourse－level information［C］/ /Proceedings of the 23th IJCAI．Beijing，China: AAAI Press， 2013: 2120－2126．

［22］ LI Q， JI H，YU H， et al．Constructing information networks using one single model［C］/ /Proceedings of the 2014 EMNLP．Doha，Qatar: ACL， 2014: 1846－1851．

［23］ CHEN Y，XU L，LIU K，et al．Event extraction via dynamic multi－pooling convolutional neural networks［C］/ /Proceedings of the 53rd ACL and the 7th IJCNLP． Beijing，China: ACL， 2015: 167－176．

［24］ CHEN Z， JI H．Language specific issue and feature exploration in Chinese event extraction［C］/ /Proceedings of human language technologies: the 2009 NAACL，volume: short papers．Boulder，Colorado，USA: ACL， 2009: 209－212．

［25］ LIN H，LU Y，HAN X，et al．Nugget Proposal Networks for Chinese event detection［C］/ /Proceedings of the 56th ACL．Melbourne，Australia: ACL， 2018: 1565－1574．

［26］ LAFFEＲTY J，MCCALLUM A，PEＲEIＲA F C N．Conditional random fields: Probabilistic models for segmenting and labeling sequence data［C］/ /Proceedings of the 18th intelligence conference on machine learning．Francisco，CA，USA: Morgan Kaufmann Publishers Inc， 2001: 282－289．

［27］ LI P，ZHOU G，ZHU Q， et al．Employing compositional semantics and discourse consistency in Chinese event extraction［C］/ /Proceedings of the 2012 joint conference on EMNLP and computational natural language learning．Jeju Island，Korea: ACL， 2012: 1006－1016．

【本文地址】

公司简介

联系我们