×

基于远距离监督和模式匹配的属性抽取方法

消耗积分:1 | 格式:rar | 大小:0.98 MB | 2017-12-23

分享资料个

  针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的F值达到55. 37%,显著高于评测最好成绩(F值34. 38%)和基于条件随机场(CRF)的有监督序列标注方法(F值43. 79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性。

基于远距离监督和模式匹配的属性抽取方法

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !