OCR前沿学术成果汇总!广告OCR技术研究与应用&手写体文字识别新思考

AI算法与图像处理

共 1045字,需浏览 3分钟

 ·

2022-05-16 10:47

2022年4月24日,由中国图象图形学学会、中国自动化学会、《中国图象图形学报》联合主办,CSIG文档图像分析与识别专委会、CAA模式识别与机器智能专委会、《中国图象图形学报》联合承办的OCR学术前沿及产业应用高峰论坛成功在线举办,来自学术界及工业界17名特邀专家做了精彩报告,本期带来本次论坛的第4-6个特邀报告的视频录播。

特邀报告4广告OCR技术研究与应用

特邀讲者:王红法腾讯计算机系统有限公司, 专家研究员)

点击图中播放按钮可观看

报告摘要网络广告是互联网公司重要的商业模式,对于文本/图像/视频的精准理解已经成为众多实际应用的核心诉求。通过CV、NLP、多模态等AI技术手段,可以显著提升对于广告创意、用户偏好的理解程度,从而更好的服务广告业务。文字识别技术是这些技术手段能够发挥作用的基石,基于图片文字、视频文字的精准识别,可以极大的提升整个AI任务的效果。本次分享将介绍团队在图片/视频文字识别方面的一些技术积累、技术应用以及展望

特邀报告5OCR实践与技术创新   

特邀讲者: 陈景东,蚂蚁集团-CTO线,资深算法专家

点击图中播放按钮可观看
报告摘要: OCR技术在蚂蚁服务用户和小微商户场景中有多样化的应用,如用户/商户线上认证,保险智能理赔,企业信息服务等。在大规模的实践应用中对OCR技术提出了全方位的挑战,如何以统一的范式服务多样化的垂直领域,如何对领域知识建模来实现精准的文档图像结构化,如何鉴别存证的可靠性等。这些挑战为OCR技术发展注入了新的动力,同时为跨技术域融合创新提供了新的视角。

特邀报告6手写体文字识别新思考——数据、方法及应用

特邀讲者:金连文(华南理工大学电子与信息学院,教授)

点击图中播放按钮可观看
报告摘要:手写文字识别已经有超过40年的研究历史,由于字符类别数巨大(国标GB18010-2001收录的文字类别数高达27533类)、不同书写者风格差异大、连笔/行书/草书等书写随意性高、手写数学公式结构复杂、以及存在不少极易混淆的手写相似字等因素,使得非受限情况下的手写文字识别仍然是一个极具挑战的研究问题。本报告将简要回顾目前手写文字识别领域的主要研究进展及方法体系,介绍基于深度学习模型的手写体数据生成、segmentation-based和segmentation-free的手写文字识别、以及基于Transformer的手写文字识别等新方法,并展示部分新技术成果的实际应用。

浏览 105
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报