EDA增强数据的方法

EDA/IC设计

1047人已加入

描述

  (1)同义词替换(SynonymsReplaceSR)

  随机从句子中抽取n个词(抽取时不包括停用词),然后随机找出抽取这些词的同义词,用同义词将原词替换。例如将句子“我比较喜欢猫”替换成“我有点喜好猫”。通过同义词替换后句子大概率还是会有相同的标签的。

  (2)随机插入(RandomlyInsertRI)

  随机从句子中抽取1个词(抽取时不包括停用词),然后随机选择一个该词的同义词,插入原来句子中的随机位置,重复这一过程n次。例如将句子“我比较喜欢猫”改为“我比较喜欢猫有点”。

  (3)随机交换(RandomlySwapRS)

  在句子中,随机交换两个词的位置,重复这一过程n次。例如将句子“我比较喜欢猫”改为“喜欢我猫比较”。

  (4)随机删除(RandomlyDeleteRD)

  对于句子的每一个单词,都有p(=α)的概率会被删除。例如将句子“我比较喜欢猫”改为“我比较猫”。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分