大文本数据集的间接谱聚类-电子发烧友网

　　针对谱聚类存在计算瓶颈的问题，提出了一种快速的集成算法，称为间接谱聚类。它首先运用K-Means算法对数据集进行过分聚类，然后把每个过分簇看成一个基本对象，最后在过分簇的级别上利用标准谱聚类来完成总体的聚类。将该思想应用于大文本数据集的聚类问题后，过分簇中心之间的相似性度度量方法可以采用常用的余弦距离法。在20-Newgroups大本数据上的实验结果表明：间接谱聚类算法在聚类准确性上比K-Means算法平均高出14. 72%；比规范割谱聚类仅低0.88%，但算法所需的计算时间平均不到规范割谱聚类的1/16，且随着数据集的增大当规范割谱聚类遭遇计算瓶颈时，提出的算法却能快速地给出次优解。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

大文本数据集的间接谱聚类

基于稀疏高维大数据的增量模糊聚类算法

基于主题模型的Web服务聚类方法综述

基于谱聚类的多目标复杂网络社区发现算法

基于聚类的大数据应用数据缺失值充填方法

一种基于分块集成的图像聚类算法

基于聚类质量的改进非负矩阵分解算法

基于聚类网络的文本-视频特征学习综述

可提取非线性结构的子空间聚类方法

基于群组和密度的大规模轨迹聚类算法

按照特征分组聚类的异常入侵检测系统

基于主题相似度聚类的文本分类算法综述

使用新的距离度量方式的增量式聚类算法

一种改进的密度峰值聚类图像分割算法

基于成对学习和图像聚类的肺癌亚型识别

空间文本数据流上连续查询评估技术应用

融合文本分类和摘要的多任务学习摘要模型

一种动态区间的加权模糊聚类算法

一种头脑风暴算法优化的乳腺MR图像软子空间聚类算法

一种基于自然最近邻的密度峰值聚类算法

一种自适应的关联融合聚类算法

一种基于检测器集层次聚类的否定选择算法

利用k-prototype聚类的差分隐私混合数据发布算法

基于BP神经网络分类器的垃圾文本过滤模型

基于比特币交易数据的增量聚类方法

面向时序事件的动态矩阵聚类方法RDMC

针对高维稀疏数据的可重叠子空间K-Means聚类算法

异构文本数据转换过程中解析XML文本的方法对比

一种改进的聚类联合相似度推荐算法

可检测出租车载客的轨迹聚类算法

基于加权核非负矩阵分解的短文本聚类算法的资料说明

如何使用拉普拉斯中心性和密度峰值进行无参数聚类算法的研究

数据降维聚类工具介绍——SpatialPCA

如何使用自然语言处理分析文本数据

如何构建高质量的大语言模型数据集

对话文本数据是培养大模型的智能与交流之源

对话文本数据的珍贵贡献：训练大模型赋予智能与情感理解

大型模型的重要基石与洞察力之源之文本数据

自然语言理解问答对话文本数据，赋予计算机智能交流的能力

问答对话文本数据：解锁智能问答的未来

问答对话文本数据，构建智能问答对话系统的基础

基本数据类型分享

如何在 Python 中安装和使用顶级聚类算法

文本处理技巧之正则表达式

PyTorch文本分类任务的基本流程

10种聚类算法和Python代码4

10种聚类算法和Python代码3

10种聚类算法和Python代码2

10种聚类算法和Python代码1

深度学习聚类的综述

10种顶流聚类算法Python实现（附完整代码）

深度学习聚类的综述

K-means聚类算法指南

SDL显示文本

基于有效样本数的类平衡损失

10种聚类介绍和Python代码

K-MEANS聚类算法概述及工作原理

如何在python中安装和使用顶级聚类算法?

textCNN论文与原理——短文本分类

100天搞定机器学习：day54 聚类系列：层次聚类原理及案例

常见的几种聚类算法

正确选择聚类算法的建议

下载排行榜