一种优化的CHI特征选择方法-电子发烧友网

　　文本信息处理技术是信息检索研究特别是基于Web的信息挖掘研究领域的重要研究方向，而文本自动分类技术是文本信息处理的重要研究内容。文本自动分类（Text Categorization，TC）是指根据待分类文本的具体内容将其自动划分到相应的一个或几个文本类别里。通常使用向量模型用于文本表示，使用文本中的单词或词组作为文本特征项。高维的文本向量不仅使得计算开销加大，而且相应的数据稀疏性问题严重影响着分类算法性能，降低了分类的效率。因此有效的文本特征降维方法成为提高文本分类效率的重要途径。

　　特征选择是文本自动分类的核心技术。针对经典的CHI模型不足之处，本文首先从特征项与类别之间的正负相关性角度对特征项进行删减；然后针对类偏斜分类环境下的特征项权重进行调整；进而以特征项的词频数为依据，从特征项在文本中的具体位置、特征项的类内及类间分布等层面再对模型逐步改进，提出了一种优化的CHI特征选择方法。随后的文本分类试验验证了该方法的有效性。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

一种优化的CHI特征选择方法

一种改进的局部和相似度保持特征选择算法

一种语义特征图引导的青光眼筛查方法

基于特征图融合的小尺寸人脸检测方法

一种线性插值随机对偶平均优化方法

一种全新的脉搏信号时域特征点识别方法

一种DGA域名通用特征的提取方案

一种基于用户偏好的权重搜索及告警选择方法

联合多流行结构和自表示的无监督特征选择方法

一种融合多重特征的信源个数估计方法

一种全新的遥感图像描述生成方法

一种基于DSCNN-BILSTM的入侵检测方法

一种基于信息熵与综合函数特征提取

一种侧重于学习情感特征的预训练方法

一种基于DE和ELM的半监督分类方法

一种面向铁路文本分类的字符级特征提取方法

一种融合深度和浅层特征的多视觉癫痫检测算法

一种融入社会影响力的粒子群优化算法

一种基于特征融合的感受野模型

一种多粒度融合的模糊规则系统图像特征学习算法

一种基于局部后悔的在线核选择方法

基于最大信息系数与冗余分摊策略的特征选择方法

一种针对小样本学习的双路特征聚合网络

一种针对DoT算法的模板攻击方法

一种基于框架特征的共指消解方法

一种改进FAST-CNN的超新星目标检测方法

一种适用于动态场景的SLAM方法

一种改进的加密恶意流量检测方法

融合神经网瓶颈特征与MFCC特征的符合特征构造方法

一种针对中英混合文本的多维度多情感分析方法

一种改进的花朵授粉算法的WEB服务组合优化

机器学习如何进行特征选择

英诺达分享一种无效开关动态功耗优化思路

一种无序超均匀固体器件的网格优化方法

一种基于点、线和消失点特征的单目SLAM系统设计

一种面向飞行试验的数据融合框架

一种简单高效配置FPGA的方法

rup是一种什么模型

人脸检测的五种方法各有什么特征和优缺点

通过强化学习策略进行特征选择

一种八腔带通腔体滤波器的设计方法

一种产生激光脉冲的新方法

CHI架构的基础知识

五种先进的SSD故障预测特征选择方法盘点

介绍一种基于中位数的离群值检测方法

缓存一致性验证 – AMBA CHI中的新功能

一种制造光子时间晶体的方法介绍

用于快速高保真RGB-D表面重建的神经特征网格优化的GO-Surf

一种用于视觉定位的2D-3D匹配方法GAM

一种新的方法来优化混凝土3D打印建筑的拓扑结构

一种简单的OpenHarmony环境搭建方法

一种应用于测量和优化开关系统控制环路的方法

浅述一种基于局部特征分析的多聚焦图像融合方法

一种使用快速行进水平集方法进行距离变换的三维中轴提取算法

一种复制和粘贴URL的新方法

探讨机器学习中特征选择的4种方法

机器学习之特征提取 VS 特征选择

机器学习特征选择的三种方法

一种基于视频流的自监督特征表达方法

一种基于RefineDet多层特征图融合的多尺度人脸检测方法

基于一种深度强化学习技术的微电网实时能源优化方法介绍

教你如何做特征选择

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3588系列开发板-产品资料更新-2026.06

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

OK3506-S12 Mini开发板产品资料-2025.10

FS4056HS 30V高耐压输入单节锂电充电芯片规格书