图像识别技术在档案OCR工作中的应用
原载于《中国档案报》
作者:徐亮
光学字符识别(Optical Character Recognition,OCR)是将图像中的文字信息转化为可供计算机处理的字符信息的技术,发挥着计算机“眼睛”的功能,是机器与现实世界进行视觉交互的重要技术基础。早期的OCR技术可追溯到1870年,电报技术和为盲人设计的阅读设备的出现标志着OCR的诞生。近年来,随着人工智能技术在OCR中的实际应用,OCR的性能和效率都得到了很大的提升。如今,基于人工智能的OCR已经广泛应用于金融、交通、政务、司法、医疗等多个领域,进入到人们生产生活的方方面面。
档案OCR是利用OCR技术对纸质档案数字化副本等图像文件中的字符形状进行识别、文字转换和文本输出、呈现的过程。利用人工智能技术开展档案OCR工作,对于提高工作效率和准确性,加快自动著录、全文检索、数据分析等系统功能更好实现,推动档案信息资源建设从数字化向数据化转型具有重要意义。
档案OCR工作现状
传统OCR的不足
基于人工智能技术的OCR
编辑:SAN
End
声明:部分内容来源于网络,仅供读者学术交流之目的。文章版权归原作者所有。如有不妥,请联系删除。
评论