针对无纸化考试系统入库试题重复检测问题;提出基于卡方检验与词义分析的试题重复检测算法,首先自动提取试题的特征信息词项,利用卡方检验改进公式进行特征词分析并删除冗余词;其次,结合中文WordNet词典对特征词进行词义分析,并利用Tf-Idf方法计算入库试题的特征词向量与不同题型特征词的余弦相似度;最后,根据所得相似度值判别该试题是否与题库试题重复。实验结果表明,在重复度阀值选取0.8时,算法耗时少、准确性高。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !