现阶段,语言文字在人们生产生活中的应用以知识密集型的文档形式居多,如何借助自然语言处理、知识图谱、光学字符识别等人工智能关键技术实现文档处理的自动化、数字化、智能化,近年备受学术界和产业界关注。
为促进智能文档处理技术和产品的标准化及规范化发展,中国信息通信研究院(以下简称“中国信通院”)联合多家核心参编单位,共同编制标准《自然语言处理技术及产品评估方法 第8部分:智能文档处理系统》。标准总体分为技术能力、产品能力和应用能力三个模块,聚焦产品技术性能优越度、功能完备度和应用成熟度提出技术要求和评估方法。
目前,中国信通院已参考上述标准完成首轮智能文档出处理产品评测,累计为4家企业提供8个模块的产品评测。10月25日至28日,卫士通人工智能数据安全分析服务平台参与中国信通院组织的第二轮“可信AI”智能文档处理测评工作,并顺利完成技术能力模块测评。此次测评,共涉及2个能力域、10个能力项和20余项关键指标,全方位评估智能文档处理通用技术和专用技术的性能指标。
本次参测的卫士通人工智能数据安全分析服务平台在智能文档处理的通用能力和AI核心能力方面均表现优异。在通用能力方面,该平台在信息抽取、表格文字识别、表格结构识别、版面分析、文档分类等文档处理能力均有较高的支持度。在AI核心能力方面,该平台在文本分类、实体识别、关系抽取、事件抽取、光学字符识别等指标上的准确率、召回率、F1值总体较高。 由于业务量不断增长,企业对智能化处理文档的需求也在不断增加,随之产生的数据堆积和安全等问题亟待解决。在此背景下,卫士通融合自然语言处理、知识图谱、光学字符识别等人工智能关键技术打造人工智能数据安全分析服务平台,支持解决多场景下的文档信息处理、数据安全问题。该平台依托先进的深度学习算法和海量的数据积累,提供文档智能处理、敏感数据检测、数据智能分级分类等一体化服务,实现企业文档流程化、自动化、智能化处理,并全面保障企业文档数据内容安全,助力金融、交通、医疗、政务等多种领域业务场景智能升级。
全部0条评论
快来发表一下你的评论吧 !