中文短文本聚合模型研究

消耗积分:3 | 格式:rar | 大小:2.96 MB | 2017-12-25

分享资料个

　　摘中文短文本聚合的目的是将两个数据集中属于同一对象的短文本信息进行匹配关联，同时要避免匹配不属于同一对象的短文本信息，这项研究对于多源异构的短文本数据资源整合具有重要的理论和现实意义．提出了一种有效的中文短文本聚合模型，通过快速匹配和精细匹配两个关键步骤可以大幅度降低匹配的候选对数量，并保证匹配的精度．针对传统短文本相似度算法的不足，提出了一种新颖的广义Jaro-Winkler相似度算法，并从理论上分析了该算法的参数特性．通过对不同数据集上的商户信息数据进行聚合实验，结果表明，新算法与传统算法相比，在匹配准确率和稳定性上具有最优的性能。

聚合

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

瑞芯微RK3588系列开发板-产品资料更新-2026.06
2026-06-08 6次下载

下载
ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册
2026-06-10 3次下载

下载
OK3506-S12 Mini开发板产品资料-2025.10
2026-06-08 3次下载

下载
LZC9300A 高性能恒压恒流碳化硅驱动控制芯片
2026-06-06 2次下载

下载
ZS7606XY同步整流使用规格书
2026-06-10 2次下载

下载
FS4056HS 30V高耐压输入单节锂电充电芯片规格书
2026-05-25 1次下载

下载

中文短文本聚合模型研究

40篇英语短文教你精通3500个单词

基于注意力机制的新闻文本分类模型

面向搜索的微博短文本语义建模方法综述

文本挖掘之概率主题模型综述

基于深度学习的文本主题模型研究综述

基于评分矩阵与评论文本的深度学习模型

基于LSTM的表示学习-文本分类模型

基于BGRU的中文文本情感分析方法

基于词嵌入与神经网络的文本匹配模型

面向微博热点话题的改进BBTM模型

面向短文本的中文真词错误检测与修复

面向短文本的中文真词错误检测与修复

基于语义感知的中文短文本摘要生成技术

基于聚类网络的文本-视频特征学习综述

基于不同神经网络的文本分类方法研究对比

融合内容与多特征计算的个性化微博推荐模型

基于BERT的中文科技NLP预训练模型

融合文本分类和摘要的多任务学习摘要模型

基于BERT+Bo-LSTM+Attention的病历短文分类模型

基于文本的细粒度美妆图谱视觉推理问题

一种基于BERT模型的社交电商文本分类算法

胶囊网络在短文本多种意图识别的应用及研究

基于多层CNN和注意力机制的文本摘要模型

基于双编码器网络结构的CGAtten-GRU模型

基于BP神经网络分类器的垃圾文本过滤模型

自然语言处理的图像文本建模相关研究及分析

一种针对中英混合文本的多维度多情感分析方法

基于主题模型和变分自编器的自适应知识方法

一种基于神经网络的短文本分类模型

基于神经网络的中文文本蕴含识别模型

结合BERT模型的中文文本分类算法

百度文心大模型5.0 Preview荣登LMArena文本榜国内第一

百度文心大模型5.0-Preview文本能力国内第一

如何评价OpenRouter这样的大模型API聚合平台？

NVIDIA RTX 5880 Ada显卡部署DeepSeek-R1模型实测报告

阿里云通义开源长文本新模型Qwen2.5-1M

AI大模型的最新研究进展

NVIDIA文本嵌入模型NV-Embed的精度基准

单日获客成本超20万，国产大模型开卷200万字以上的长文本处理

字节跳动辟谣推出中文版Sora 期待国产Sora大模型

亚马逊发布史上最大文本转语音模型BASE TTS

港中文贾佳亚团队联手MIT发布超长文本扩展技术，打破LLM遗忘魔咒

Meta发布一款可以使用文本提示生成代码的大型语言模型Code Llama

对话文本数据是培养大模型的智能与交流之源

对话文本数据的珍贵贡献：训练大模型赋予智能与情感理解

大型模型的重要基石与洞察力之源之文本数据

基于文本到图像模型的可控文本到视频生成

Meta开源文本如何生成音乐大模型

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

ELMER: 高效强大的非自回归预训练文本生成模型

一种「个性化」的文本到图像扩散模型 DreamBooth

摘要模型理解或捕获输入文本的要点

基于文本驱动的三维模型风格化方法

快速了解文本语义相似度领域的研究脉络和进展

受控文本生成模型的一般架构及故事生成任务等方面的具体应用

全球人工智能技术创新大赛短文本语义匹配方案技巧

知乎搜索中文本相关性和知识蒸馏的工作实践

OpenAI发布根据文字生成图像的人工智能系统

textCNN论文与原理——短文本分类

NLP中文自然语言处理数据集、平台和工具整理

运用多种机器学习方法比较短文本分类处理过程与结果差别

下载排行榜

瑞芯微RK3588系列开发板-产品资料更新-2026.06

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

OK3506-S12 Mini开发板产品资料-2025.10

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片

ZS7606XY同步整流使用规格书

FS4056HS 30V高耐压输入单节锂电充电芯片规格书