×

连续属性离散化的Imp-Chi2算法

消耗积分:3 | 格式:rar | 大小:161 | 2009-04-17

张生

分享资料个

连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究
Chi2 系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2 算法,该算法依据属性重要性程度对属性离散化的顺序
进行了合理的调整,能够更准确地对连续属性进行离散化。文章通过C4.5 和支持向量机分别对离散化后的结果进行了实验,在实验过程
中,提出一种训练集类比例抽取方法,避免了训练集随机抽取的不均匀性。实验结果证明了所提算法的有效性。
关键词:连续属性离散化;Chi2 算法;属性重要性;训练集类比例抽取

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !