如何使用PU学习进行建议语句分类的方法说明

消耗积分:0 | 格式:rar | 大小:0.86 MB | 2019-03-27

分享资料个

　　建议挖掘作为一项新兴研究任务，具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题，提出一种基于PU学习的建议语句分类方法。首先，使用简单规则从无标注评论集合中选择建议语句的正例集合;然后，为了降低特征维度，缓解数据稀疏性，在自编码神经网络（ Autoencoder）特征空间中使用Spy技术划分可靠反例集合;最后，利用正例集合和可靠反例集合来训练多层感知机（MLP）对剩余的无标注样例进行分类。该方法在中文数据集上的F1值和准确率值分别达到81. 98%和82. 67% ，实验结果表明，该方法能够有效地对建议语句进行分类，且不需要对数据进行人工标注。

　　随着互联网的快速发展，网络上出现了海量的用户评论，人们不仅会在评论中传达积极或消极的情绪，有时也会对产品、服务等提出相应的建议。例如，在“希望三星手机能支持谷歌应用商店”这条评论中虽然并未包含情感极性，但明确提出了对产品功能的改进建议。这类建议信息可以帮助厂家有效地提升产品质量，也有助于商家有针对性地制定销售策略，具有重要的应用价值，建议挖掘”研究因此应运而生。

　　进行建议挖掘，首先需要对建议语句进行分类，即将评论语句分为建议语句或非建议语句。但由于人们对建议的判定存在比较大的主观性，导致建议语句的定义难以取得-致，这给语料标注和问题定义带来了很多困难“。本文采用和文献［1］类似的方案，将明确表达了期望或提出改进意见的语句定义为建议语句。目前，建议挖掘研究l2-71虽然已经取得了一定的进展，但还存在以下问题：- -方面，已有研究大多是在英文语料上开展的，在中文语料上的相关研究很少，而中文环境和英语环境中的网络文化和建议语句的表达方式存在较大差异，因此需要深入研究中文环境下的建议语句分类方法。另- -方面，在已有研究中，用于建议语句分类的方法主要有规则方法［-31和有监督机器学习方法［4-7］。规则方法通过手工制定的规则来进行建议挖掘，需要提前建立复杂的规则模板，人工干预较多。而有监督机器学习方法虽然模型的精度较高，但模型训练过程中需要大量人工标注语料，标注工作量大，代价昂贵，并面临特征维度高、数据稀疏等问题。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

爱华AIWA HS-J202维修手册
2025-12-22 34次下载

下载
PC5502负载均流控制电路数据手册
2025-12-19 22次下载

下载
飞利浦D8714收录机说明书
2025-12-02 12次下载

下载
⼯业电源&模块电源产品⼿册
2025-11-28 6次下载

下载
H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
2025-12-10 6次下载

下载
UWB653Pro USB口测距通信定位模块规格书
2025-12-16 5次下载

下载

如何使用PU学习进行建议语句分类的方法说明

使用深度学习方法对音乐流派进行分类

基于CNN分类回归联合学习等的左心室检测方法

基于LSTM的表示学习-文本分类模型

基于机器学习的恶意代码检测分类

基于空谱联合特征的高光谱图像分类方法

基于主题分布优化的模糊文本分类方法

一种基于Q学习算法的增量分类模型

基于成对学习和图像聚类的肺癌亚型识别

融合文本分类和摘要的多任务学习摘要模型

基于自然语言生成多表SQL语句模板填充的方法

一种基于DE和ELM的半监督分类方法

最大化AUC关系的PU分类应用及相关算法

结合CSPPNet与集成学习的人类蛋白质图像分类

基于二维图像与迁移卷积神经网络的分类方法

针对遥感图像场景分类的多粒度特征蒸馏方法

基于深度神经网络的文本分类分析

Python中的基本语句详细资料说明

5种数据库的SQL语句大全详细说明

使用SQL语句创建数据库的实例详细说明

如何使用SQL修复语句程序说明

SQL的经典语句用法详细说明

Verilog HDL的语句及可综合性的详细资料简介

如何结合改进主动学习的SVD-CNN进行弹幕文本分类算法资料说明

如何进行网络背景流量的分类与识别的详细资料说明

如何使用多分类器融合进行步态识别方法的资料说明

Java的循环语句的详细资料说明

C++程序设计教程之语句的详细资料说明

C语言程序设计教程之控制语句的详细资料说明

使用深度模型迁移进行细粒度图像分类的方法说明

python基础教程之如何进行静态方法和类方法详细笔记说明

Unicore标准NEMA语句GSA及说明

国巨集团将推出两款四端分流电阻PU1216和PU2726

深度学习中的时间序列分类方法

鸿蒙TypeScript入门学习第6天：【条件语句】

光模块分类说明及区别

assign语句和always语句的用法

C语言中if语句、if-else语句和switch语句详解

深度学习算法的选择建议

条件语句/循环语句simulink的实现方法（一）

Verilog中的If语句和case语句介绍

机器学习算法的分类

Java中switch语句的使用

电机的种类与分类

什么是SystemVerilog-决策语句-if-else语句？

常见的11个分类变量编码方法

机器学习领域将算法按照学习方式分类进行问题解决

C语言中不建议使用的关键词

学习linux内核的一些建议

基本语句编程的一些规则和建议

Verilog进行组合逻辑设计时的注意事项

python判断语句的详细说明

什么是光继电器 继电器如何进行分类

如何使用Arduino KNN库进行简单的机器学习？

深度学习：小样本学习下的多标签分类问题初探

深度学习：四种利用少量标注数据进行命名实体识别的方法

深度学习中图像分割的方法和应用

30种SQL语句优化方法

select语句和update语句分别是怎么执行的

运用多种机器学习方法比较短文本分类处理过程与结果差别

学习FPGA的小建议与总结分享

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

⼯业电源&模块电源产品⼿册

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

UWB653Pro USB口测距通信定位模块规格书

什么是光继电器继电器如何进行分类