一种创新的无监督文本规范化系统

消耗积分:1 | 格式:rar | 大小:0.92 MB | 2017-12-15

分享资料个

　　推特文本中包含着大量的非标准词，这些非标准词是由人们有意或无意而创造的。对很多自然语言处理的任务而言，预先对推特文本进行规范化处理是很有必要的。针对已有的规范化系统性能较差的问题，提出一种创新的无监督文本规范化系统。首先，使用构造的标准词典来判断当前的推特是否需要标准化。然后，对推特中的非标准词会根据其特征来考虑进行一对一还是一对多规范化；对于需要一对多的非标准词，通过前向和后向搜索算法，计算出所有可能的多词组合。其次，对于多词组合中的非规范化词，基于二部图随机游走和误拼检查，来产生合适的候选。最后，使用基于上下文的语言模型来得到最合适的标准词。所提算法在数据集上获得86. 4qo的F值，超过当前最好的基于图的随机游走算法10个百分点。

一种创新的无监督文本规范化系统

无监督学习

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

STM32国内外发展现状
2024-04-08 15次下载

下载
传感芯片选型指南
2024-04-17 12次下载

下载
储能电源市场分析
2024-04-22 10次下载

下载
ATmega8芯片中文手册
2024-04-14 8次下载

下载
TDK电容器产品指南
2024-04-09 7次下载

下载
2A多电池高效开关充电器AN_SY6912A中文资料规格书
2024-04-14 7次下载

下载

全部0条评论

快来发表一下你的评论吧 !

一种创新的无监督文本规范化系统

Cat 6 布线系统现场测试规范

基于注意力机制的新闻文本分类模型

基于LSTM的表示学习-文本分类模型

基于词嵌入与神经网络的文本匹配模型

基于深度学习的评论文本推荐方法

面向短文本的中文真词错误检测与修复

面向短文本的中文真词错误检测与修复

一种特征假期朴素贝叶斯文本分类算法

基于主题分布优化的模糊文本分类方法

基于注意力机制的复杂场景文本检测方法

基于残差连接的改进端到端文本识别网络结构

联合多流行结构和自表示的无监督特征选择方法

融合文本分类和摘要的多任务学习摘要模型

一种兴趣点分层学习的全监督算法

基于跨域类和数据样本双重加权的无监督域模型

一种结合回复生成的对话意图预测模型

一种基于BERT模型的社交电商文本分类算法

一种侧重于学习情感特征的预训练方法

一种基于DE和ELM的半监督分类方法

一种面向铁路文本分类的字符级特征提取方法

一种基于光滑表示的半监督分类算法

一种带有局部坐标约束的半监督概念分解算法

基于规范化函数的深度金字塔模型算法

原理图绘制规范电子版资料下载

基于BP神经网络分类器的垃圾文本过滤模型

一种针对中英混合文本的多维度多情感分析方法

一种基于神经网络的短文本分类模型

结合BERT模型的中文文本分类算法

基于用户行为特征的多维度文本聚类

数据库-关系规范化的详细资料介绍，为什么要对进行关系的规范化？

软通咨询携手普元电力，共绘企业规范化管理与人才发展新篇章

商汤牵头制定的两项AR国家标准下达，推动行业大规模、规范化应用

医疗废物管理系统提高医废规范化管理

一种利用几何信息的自监督单目深度估计框架

浅谈硬件电路开发流程规范

Linux系统中的10个常用的文本查看命令

医疗废物在线监测系统助力医院医废规范化管理

verilog语言编写规范

使用NVIDIA NeMo进行文本规范化和反向文本规范化

一种有效的无监督深度表示器(Mix2Vec)

广凌耗材综合管理系统：高校低值易耗品，如何科学规范化管理？

一种基于伪标签半监督学习的小样本调制识别算法

怎么样才能让Java代码编写更规范化

为什么要引入远程监督方法？

文本分类的一个大型“真香现场”来了

一种处理多标签文本分类的新颖推理机制

深度学习：基于语境的文本分类弱监督学习

公路隧道LED照明灯具产品质量行业监督抽查实施规范发布

深联电路成为深圳市生态环境局宝安执法监督科首选培训学习企业

半监督学习最基础的3个概念

最基础的半监督学习

linux系统中如何创建文本菜单

IPEC推进光电标准有序发展和规范化形成

规范创新！首次提出蓝光双重检测

一种自监督同变注意力机制，利用自监督方法来弥补监督信号差异

智慧城市规范标准有什么问题

基于无监督学习和图学习的大数据挖掘

深入剖析FPGA规范化的重要性

浅析FPGA规范化的重要性

国家电网特高压规范化开工示范工程启动

下载排行榜

STM32国内外发展现状

传感芯片选型指南

储能电源市场分析

ATmega8芯片中文手册

TDK电容器产品指南

2A多电池高效开关充电器AN_SY6912A中文资料规格书