针对诉讼案件违法事实要素抽取效果依賴领堿专业知识的特点,提岀一种基于 transformer双向编码器表示( bidirec∽onal encoder representations from transformer,BERT)的诉讼案件违法事实要素自动抽取方法。首先,通过构建领域知识并采用谷歌BER预训练语言模型进行训练得到拟合诉讼案件领琙欻据的模型参欻和中文预训练字嵌λ向量作为模型的输入,得到具有上下文相关的语义表示,以提高词嵌入的上下文语义质量。其次,采用循环卷积神经网络对文本进行编码并获取在本分类任务中扮演关键角色的信息,提升案件违法事实要素抽取的效果。最后,采用 focal函数作为损失函数关注难以区分的样本。违法事实要素抽取的工作是通过对文本标签进行分类得到的。实验测试表明,该方法对诉讼案件要素抽取的F值为86.41%,相比其他方法性能均有提高。对模型注入领域内知识,也可以提高模型抽取准确率。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !