为了更好地评估Web文档数据质量,提出一种基于PAC-Baves理论的Web文档质量评估指标体系和评估方法。PAC-Bayes理论融合了PAC理论和贝叶斯定理,在充分利用样本先验信息的基础上,推导出了最紧的泛化风险边界,用于衡量学习算法的泛化性能。首先阐述了文档数据质量评估的研究现状,介绍了PAC-Baves理论框架及其在支持向量机上的应用;其次提出一种基于PAC-Baves理论的Web文档数据质量评估方法(DQAPB),将SVM算法及其PAC-Baves边界应用于Web文档的质量评价中,并构建了基于PAC-Baves理论的Web文档质量评估指标体系;最后采用Wikipedia文档进行实验,实验结果表明该方法具有简便快速、稳定性和鲁棒性较强的优点。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !