基于Spark的学术论文热点数据挖掘方法

消耗积分:0 | 格式:pdf | 大小:0.91 MB | 2021-06-02

分享资料个

　　通过优化 Spark mllib机器学习库中的隐含狄利克雷分布（LDA）主题模型，提出一种改进的学术研究热点挖掘方法。采用LDA主题模型对学术论文关键词进行建模，利用困惑度确定主题模型的最佳主题个数，并将文档-主题和主题-词概率分布矩阵转化为文档-主题和主题-词评分矩阵。通过计算背景主题与评分矩阵中各主题之间的相似度对主题进行排序，挖掘出学术论文中的研究热点。实验结果表明，该方法能提高LDA主题模型的挖掘效果，有助于发现有价值的学术研究热点主题。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

人形机器人执行、感知系统技术及市场解析
2026-05-20 50次下载

下载
瑞芯微RK3562开发板资料-飞凌嵌入式
2026-05-12 2次下载

下载
FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V
2026-05-22 2次下载

下载
瑞芯微RK3588系列开发板-产品资料更新-2026.06
2026-06-08 2次下载

下载
OK3506-S12 Mini开发板产品资料-2025.10
2026-06-08 2次下载

下载
基于图书标签的RFID智慧图书馆详细解决方案
2026-05-22 1次下载

下载

全部0条评论

快来发表一下你的评论吧 !

基于Spark的学术论文热点数据挖掘方法

2024年工控与通信行业上游发展趋势和热点解读

数据挖掘定义及方法 数据挖掘在微电子领域的应用

《教学综合管理系统》学术论文

倒F天线IEEE论文英文版.pdf

硕士学位论文《家庭智能网关的研究与实现》

功率MOSFET的驱动电路设计论文

基于数据挖掘与网络药理学的肝癌中药处方规律

基于Hive的海量公交客流起讫点挖掘方法综述

基于北斗接收机的挖掘机自动定位和引导方法

基于数据挖掘等的中医临床治疗肝癌处方用药参考

基于判断聚合模型的数据挖掘分类算法

私有二进制协议中变长域的格式挖掘综述

基于深度学习的评论文本推荐方法

面向微博热点话题的改进BBTM模型

Spark机器学习教材

数据挖掘原理与算法

融合标签语义的微博热点话题挖掘方法

基于异构网络表示方法的论文影响力预测算法

基于成本最优对齐的业务流程变化挖掘方法综述

基于协同训练的电商领域文本短语挖掘方法

基于数据挖掘的核医学文本关联规则挖掘方法

面向城市空间热点分析的可视化方法综述

基于贝叶斯网络和数据挖掘的航班延误预测方法

基于Spark平台的并行化关联规则挖掘方法

针对APP用户评论数据的软件需求挖掘方法

基于树状结构Parzen估计方法的超参数优化方法

集成流挖掘和图挖掘的内网异常检测方法

联合评论文本层级注意力和外积的推荐方法

数据挖掘在恶性肿癌与工业污染之间的应用

从日志数据挖掘高质量数据的DTS算法

大唐微电子亮相ICCCS 2026国际计算机与通信系统学术会议

如何在DGX Spark上运行NVIDIA Omniverse

奥松电子协办第二届智能计算与数据挖掘国际学术会议

博世碳化硅MOSFET研究论文荣获PCIM Asia 2025优秀墙报奖

DCS系统I/O点数计算方法与原则

中科曙光受邀参加第十届中国数据挖掘会议

spark运行的基本流程

Spark基于DPU的Native引擎算子卸载方案

RDMA技术在Apache Spark中的应用

开放下载！CadenceLIVE China 2023 中国用户大会论文集

NVIDIA 携手腾讯开发和优化 Spark UCX 实现性能跃升

中国跃居钙钛矿电池研究大国，论文发表篇数领先美日韩

机器学习与数据挖掘的区别 机器学习与数据挖掘的关系

数据挖掘十大算法

python数据挖掘与机器学习

机器学习与数据挖掘的对比与区别

使用SPARK和Ada进行代码清理

Apache Spark 3.2有哪些新特性

数据规模下使用Spark时遇到的挑战

数据挖掘的定义及算法

Spark SQL的概念及查询方式

基于多视图协作学习的人岗匹配研究论文提要

大数据分析中Spark，Hadoop，Hive框架该用哪种开源分布式系统

推荐10篇经典人工智能学术论文

机器学习的任务：从学术论文中学习数据预处理

Apple与CMU研究人员展示了让传统设备更智能的解决方案

AI领域论文中国发表数超越欧洲，占比达28％

苹果的Apple Watch可以用来数据监测痴呆症

快速学习Spark和Hadoop的架构的方法

数据挖掘工程师面试指南

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3562开发板资料-飞凌嵌入式

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

瑞芯微RK3588系列开发板-产品资料更新-2026.06

OK3506-S12 Mini开发板产品资料-2025.10

基于图书标签的RFID智慧图书馆详细解决方案

数据挖掘定义及方法数据挖掘在微电子领域的应用

机器学习与数据挖掘的区别机器学习与数据挖掘的关系