×

基于免疫算法的文本分类研究

消耗积分:0 | 格式:rar | 大小:169 | 2009-08-28

李艳

分享资料个

借鉴免疫的生物学机理,本文提出了一种基于抗体浓度的克隆选择算法,该算法中抗
体的选择概率由亲和度与浓度共同决定,具有高亲和度和低浓度的抗体才受到促进。该算法在文本分类领域得到了成功应用。在文本分类的应用中,抗原、B 细胞和抗体分别对应训练文本、分类器的一个解和分类器的解与训练文本的亲和度,最后训练完成的分类器含有多个记忆细胞,有效保证了解的多样性。在数据集20_newsgroups[1]上的实验结果显示,该方法的综合性能指标F1 可达80.90%,优于Rocchio 法与Naïve Bayes 法。
关键词文本分类,免疫,克隆选择,抗体浓度
随着网络的快速发展,数字化文本也得到了爆炸性的增长,随之而来的问题就是如何管
理和利用这些资源。通常,文本资源的管理都是建立在自动文本分类的基础上的。
自动文本分类的任务是把未知类别的文本分到已知类别中,实现对文本的分类管理。文
本分类涉及到人工智能、模式识别、机器学习、统计理论等学科,已经有很多方法成功应用到分类中,如朴素贝叶斯、K 近邻、Rocchio、决策树、支持向量机等[2]。
本文基于免疫算法对文本分类进行研究,旨在针对大规模文本时提高分类性能。
本文结构如下:第二节介绍相关的免疫概念及生物学机理,第三节介绍克隆选择算法并
提出基于抗体浓度的克隆选择算法,第四节为其在文本分类中的应用,第五节给出实验结果,最后总结全文。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !