×

一种基于差分编码的RDF分组压缩算法

消耗积分:0 | 格式:pdf | 大小:1.12 MB | 2021-03-17

分享资料个

  语义网技术的发展使资源描述框架(RDF)的数据量迅速增长,导致其对存储空间与传输带宽的要求不断提高。现有的通用压缩方法和RDF专用压缩方法可以解决该问题,但仍存在数据冗余。为此,提出一种基于差分编码的RDF分组压缩算法。将RDF数据根据连接宾语的谓语组合进行分组,在消除宾语冗余的同时进一步减少谓语冗余。在此基础上,针对分组后得到的主语序列,通过引入差分编码技术进一步优化其存储空间。实验结果显示,与Pain、HDT和HDT++算法相比,该算法在结构化程度低的 Archives hub、 Linkedmdb、 rdfabout和 Dbpedia数据集中可获得平均17%的性能提升,在结构化程度高的 dbtune数据集中可获得23%的性能提升,表明其对于不同结构化程度的数据集均具有较好的RDF压缩性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !