近年来未知的计算机漏洞欻量呈海量増长状态,对于大量的漏洞数据进行及时准确的分析和分类管理,是十分重要且有待解决的问题。因此,提出一种基于信息熵与综合函数(S-C)特征提取,并利用关联了特征词集间相互关系的平均一阶依赖贝叶斯模型(AODE)分类器的分类方法对计算机漏洞描述信息进行文本分类。首先,利用S-C特征提取法提取特征词。通过结合词语的类间重要程度和类内重要程度的综合函数C,计算出词语对于类别的重要程度。再利用词语对于类别间的信息熵S,来弱化对于分类较为混乱的词语的重要程度,选取得到准确的特征词集。最后,利用关联了特征词集间相互关系的ADE对漏洞数据集进行分类。通过实验对比表明,S-C特征提取法能够提取准确的特征词集,并且结合AODE分类器的分类准确率要高于传统的分类器模型。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !