基于聚类和Spark框架的加权Slope One算法-电子发烧友网

　　针对传统Slope One算法在相似性计算时未考虑项目属性信息和时间因素对项目相似性计算的影响，以及推荐在当前大数据背景下面临的计算复杂度高、处理速度慢的问题，提出了一种基于聚类和Spark框架的加权Slope One算法。首先，将时间权重加入到传统的项目评分相似性计算中，并引入项目属性相似性生成项目综合相似度；然后，结合Canopy-K-means聚类算法生成最近邻居集；最后，利用Spark计算框架对数据进行分区迭代计算，实现该算法的并行化。实验结果表明，基于Spark框架的改进算法与传统Slope One算法、基于用户相似性的加权Slope　One算法相比，评分预测准确性更高，较Hadoop平台下的运行效率平均可提高3.5 -5倍，更适合应用于大规模数据集的推荐。

基于聚类和Spark框架的加权Slope One算法

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

基于聚类和Spark框架的加权Slope One算法

基于稀疏高维大数据的增量模糊聚类算法

基于谱聚类的多目标复杂网络社区发现算法

基于Xie-Beni指数的选择性聚类集成算法

面向SNP的模糊聚类算法及研究综述

基于特征和实例迁移的加权多任务聚类算法

评分矩阵与联合聚类的推荐算法

一种基于分块集成的图像聚类算法

基于加权LeaderRank的用户社交网络排序算法

基于最优传输距离和聚类的WSN分簇算法

基于聚类质量的改进非负矩阵分解算法

基于群组和密度的大规模轨迹聚类算法

使用新的距离度量方式的增量式聚类算法

一种改进的密度峰值聚类图像分割算法

基于成对学习和图像聚类的肺癌亚型识别

基于混合蛙跳算法的K-mediods聚类算法

集成簇内和簇间距离的加权k-means聚类方法

基于改进的Canopu和共享最近邻的聚类算法

改进的DBSCAN聚类算法在Spark平台上的应用

一种动态区间的加权模糊聚类算法

一种头脑风暴算法优化的乳腺MR图像软子空间聚类算法

基于共识率和加权样本的标记传播算法CRLP

一种基于自然最近邻的密度峰值聚类算法

基于MapReduce和加权网络信息熵的DBWGIE-MR算法

一种自适应的关联融合聚类算法

基于核诱导的不完整多视觉聚类算法KIMV

利用k-prototype聚类的差分隐私混合数据发布算法

离线批处理与OPTICS在轨迹聚类中的应用

基于比特币交易数据的增量聚类方法

针对高维稀疏数据的可重叠子空间K-Means聚类算法

一种改进的聚类联合相似度推荐算法

可检测出租车载客的轨迹聚类算法

广汽能源与泰国Spark EV签订合作框架协议

Spark基于DPU的Native引擎算子卸载方案

Spark基于DPU Snappy压缩算法的异构加速方案

深度学习框架和深度学习算法教程

人工智能有哪些算法

介绍一种基于最小化平方误差的聚类算法

如何在 Python 中安装和使用顶级聚类算法

10种聚类算法和Python代码4

10种聚类算法和Python代码3

10种聚类算法和Python代码2

10种聚类算法和Python代码1

深度学习聚类的综述

10种顶流聚类算法Python实现（附完整代码）

深度学习聚类的综述

K-means聚类算法指南

LINS算法的框架与代码分析

10种聚类介绍和Python代码

基于距离的聚类算法K-means的设计实现

K-MEANS聚类算法概述及工作原理

一文详细了解APACHE SPARK开源框架

剖析Spark的两种核心Shuffle

剖析彩色视频运动目标自适应在线聚类提取算法

最实用的的五种机器学习算法

如何在python中安装和使用顶级聚类算法?

100天搞定机器学习：day54 聚类系列：层次聚类原理及案例

金融机构使用案例分析机器学习算法——聚类clustering

大数据分析中Spark，Hadoop，Hive框架该用哪种开源分布式系统

噪声中的加权-什么是加权

常见的几种聚类算法

正确选择聚类算法的建议

下载排行榜