在前些天的2021世界人工智能大会上,上海合合信息科技股份有限公司带来的智能文字识别技术吸引了众多关注。合合信息将形象丰富的甲骨文进行排列组合后,再将其复刻在龟甲上,组合成了一个个网络热词,如“单身狗”、“白富美”、“买它买它”等依次被识别出来。令人忍俊不禁的同时,也让大家看到了合合信息在智能文字识别领域的研究成果——能“读懂”甲骨文的智能文字识别技术,成为全场最受关注的 “黑科技”产品之一。
甲骨文出土于商代,因刻写在龟甲和兽骨上而出名,是我国已发现的古代文字中时代最早、体系较为完整的文字,也是世界四大古文字之一。但因年代久远,多数甲骨残缺严重,素材获取困难,拓片清晰度较低等问题,给甲骨文的识别带来了困难。而以图片形式出现在出版物上的甲骨文,也给文字检索带来了难题。
随着数字化、智能化时代的到来,伴随着人工智能的引进,甲骨文学者有了新的帮手——智能识别技术,能实现甲骨文的自动识别、撮合,既有效提高了甲骨文识别的质量,也提高了甲骨文识别工作的效率。
据了解,本次大会上合合信息展示的智能文字识别技术主要有三个核心技术层,首先是智能图像处理技术,能对用户拍摄的复杂文档图像进行预处理,有效提升了文档图像质量;其次是基于深度学习的复杂场景文字识别技术,能应对各种复杂场景下文字识别,主要是利用合合信息自主研发的手写印刷混排识别、防强干扰识别、扭曲文字和复杂印章识别等一系列的先进深度学习识别技术;最后是自然语言处理技术,可对识别出来的文字进行下一步的文意解读和语义理解。
合合信息的智能文字识别技术的落地场景是考古工作者及博物馆工作者,将甲片信息录入到电子信息中,依靠该智能转换识别技术能提升他们信息采集及录入等相关工作的效率。从长远来看,合合信息希望对甲骨文的阅读、对研究古文的文学价值、历史价值及书法价值,做出贡献和帮助。
除了甲骨文外,合合信息还展示了该技术能识别50多种不同国家的一些语言,包含不同的文字大小和样式,达到了秒级识别的水平。未来,合合信息将继续探索文字识别领域,致力将其广泛应用于各种实际场景。
fqj
全部0条评论
快来发表一下你的评论吧 !