如何使用Spark计算框架进行分布式文本分类方法的研究

消耗积分:0 | 格式:rar | 大小:1.04 MB | 2018-12-18

分享资料个

　　针对传统文本分类算法在面对日益增多的海量文本数据时效率低下的问题，论文在Spark计算框架上设计并实现了一种并行化朴素贝叶斯文本分类器，并着重介绍了基于Spark计算框架的文本分类实现过程。实验阶段，分别在单机、Map Reduce和Spark三种不同的计算框架下测试了文本分类的效率，并使用控制变量的方法在Spark计算框架下设计对照实验。实验证明，Spark计算框架下的朴素贝叶斯算法在面对海量文本分类时有着较高的处理效率。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

PC5502负载均流控制电路数据手册
2025-12-19 20次下载

下载
飞利浦D8714收录机说明书
2025-12-02 12次下载

下载
RK3506B原理图参考设计
2025-11-21 8次下载

下载
H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
2025-12-10 6次下载

下载
人工智能+消费：技术赋能与芯片驱动未来
2025-11-26 6次下载

下载
⼯业电源&模块电源产品⼿册
2025-11-28 5次下载

下载

如何使用Spark计算框架进行分布式文本分类方法的研究

雷达的基本分类方法

基于OpenHarmony的分布式应用开发框架使用教程

基于注意力机制的新闻文本分类模型

高效快速的分布式水军群检测算法

基于LSTM的表示学习-文本分类模型

IG_CDmRMR二阶段文本特征选择方法

MapReduce框架下分布式编码计算容错算法

一种特征假期朴素贝叶斯文本分类算法

基于主题分布优化的模糊文本分类方法

基于神经网络与隐含狄利克雷分配的文本分类

基于双通道词向量的卷积胶囊网络文本分类算法

基于DSP的航空发动机分布式总线设计方案

基于不同神经网络的文本分类方法研究对比

基于主题相似度聚类的文本分类算法综述

融合文本分类和摘要的多任务学习摘要模型

基于BERT+Bo-LSTM+Attention的病历短文分类模型

一种基于BERT模型的社交电商文本分类算法

一种优化的分布式二维卷积算法

一种面向铁路文本分类的字符级特征提取方法

基于分布式数据Cache的实时动态迁移机制

一种可行的分布式存储系统安全构造方法

基于预分区策略的分布式数据存储方法

集成WL-CNN和SL-Bi-LSTM的旅游问句文本分类算法

一种针对中英混合文本的多维度多情感分析方法

一种分布式网络扫描架构和任务调度算法

一种基于神经网络的短文本分类模型

结合BERT模型的中文文本分类算法

基于深度神经网络的文本分类分析

如何通过YARN设计分布式资源动态调度协同分配系统

如何结合改进主动学习的SVD-CNN进行弹幕文本分类算法资料说明

如何使用ODL进行分布式任务并发协调一致的研究资料分析

卷积神经网络在文本分类领域的应用

Spark基于DPU的Native引擎算子卸载方案

OpenHarmony开发案例：【分布式计算器】

人工智能中文本分类的基本原理和关键技术

redis分布式锁三个方法

分布式通信是什么 分布式网络搭建

springclould分布式教程

spring分布式框架有哪些

Spark 3.4用于分布式模型训练和大规模模型推理

NLP中的迁移学习：利用预训练模型进行文本分类

PyTorch文本分类任务的基本流程

深度学习——如何用LSTM进行文本分类

OpenHarmony技术论坛：分布式相机和分布式图库功能

一文详细了解APACHE SPARK开源框架

带你从头构建文本分类器

openEuler Summit 2021-分布式/多样性计算分论坛：仿真软件弹性计算分布式多样性

欧拉(openEuler)的分布式能力加速举例

openEuler Summit2021:分布式计算的缺陷

分布式调度子系统--初步研究

HarmonyOS测试技术与实战-分布式UI测试框架

探究超大Transformer语言模型的分布式训练框架

Google Brain和DeepMind联手发布可以分布式训练模型的框架

一种为小样本文本分类设计的结合数据增强的元学习框架

文本分类的一个大型“真香现场”来了

一种处理多标签文本分类的新颖推理机制

textCNN论文与原理——短文本分类

IIOT分布式计算发布，可使基于数据中心的云计算更靠近物联网设备

关于分布式系统的几个问题

大数据分析中Spark，Hadoop，Hive框架该用哪种开源分布式系统

盘点分布式存储系统的主流框架

下载排行榜

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

RK3506B原理图参考设计

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

人工智能+消费：技术赋能与芯片驱动未来

⼯业电源&模块电源产品⼿册

分布式通信是什么分布式网络搭建