关系抽取笔记

综述(一)

Posted by Pelhans on May 5, 2019

论文 Relation Extraction: A Survey 的中文翻译,并对其中提到的模型进行补充。

摘要

随着互联网的出现,每天都会以新闻文章,研究出版物,博客,问答论坛和社交媒体的形式产生大量的文本。开发从这些文档中自动提取信息的技术是非常重要的,因为许多重要信息都隐藏在其中。提取的信息可用于改进对大文本语料库中隐藏的知识的访问和管理。诸如问答,信息检索等几个项目将受益于此信息。像个人和组织这样的实体构成了信息的最基本单位。句子中实体的出现通常通过明确的关系联系在一起;例如,句子中人和组织的出现可以通过诸如使用的关系来链接。关系提取(RE)的任务是自动识别这种关系。在本文中,我们调查了几种重要的有监督,半监督和无监督的RE技术。我们还介绍了开放信息提取(OIE)和远程监督的范例。最后,我们描述了RE技术的最新趋势以及未来可能的研究方向。这项调查对三种读者都很有用 - i)该领域的新人想要快速了解RE; ii)想要了解各种关系抽取技术如何随着时间的推移而演变的研究人员以及未来可能的研究方向,以及iii)只需知道哪种关系抽取技术在各种配种中效果最佳的从业者。

介绍