在信息抽取领域,命名实体识别方法可以为实体赋予正确的语义,实体关系抽取则可以明确两个实体间的关系语义。但从知识的角度来看,无论是命名实体识别还是实体关系抽取都属于“小粒度”限口识片段)的抽取,抽取结果并非独立完整的知识实例。命名实体识别和实体关系抽取的成果只有经过知识合成才能成为独立完整的知识实例。但由于知识体系的复杂性和多样性,合成“知识片段”往往是非常困难的。此外,传统的信息抽取主要采用基于规则的方法,这种方法会导致在抽取信息时因无法克服不同的信息项满足同一或具有包含关系抽取规则时无法确定信息项类型的问题。
本体是共享的、规范化的概念模型,是对某一领域中知识结构的系统描述,因此从知识的角度来看,领域本体是知识抽取最有效的工具之一。但从目前来看,基于本体信息抽取和知识抽取的研究工作对领域本体的利用非常有限,且主要集中在一些信息本身格式和信息上下文格式的利用;而领域本体中蕴含的逻辑知识以及推理能力很少被利用,因此这类方法在抽取结构比较复杂的知识时抽取效果就明显下降了。
本文研究的思路是:将领域本体中蕴含的逻辑知识转换为一个Alloy语言表示的模型,在完成命名实体识别和实体关系抽取的基础上,使用约束逻辑求解方法(Alloy分析器)来对领域内的信息进行更为精确的定位,最终得到一个具有明确语义的知识实例。本文的组织如下,第二节给出两个引例,明确本文要解决的问题;第三节介绍相关的概念;第四节是本文的重点,介绍知识抽取的算法;第五节是实验;最后是相关工作和结论。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !