AI奇妙夜 | 从数据驱动到模型自监督学习,金连文教授带你解密OCR

光学文字识别(OCR)技术在信息录入、图像理解、智慧金融、智能办公、智慧教育、电子商务、信息安全、文化传承等诸多领域有非常广阔的应用前景,是计算机视觉及人工智能领域的重要研究问题之一。近年来,基于数据驱动的深度学习技术已成为OCR领域的主流方法,但其性能极大依赖费时费力的海量数据收集和标注。
在今天的课程中,金连文教授将从如何低成本利用大规模数据、如何降低深度学习模型对标签数据的依赖这一视角,来为大家介绍OCR领域一些新的研究进展,并对此领域的一些重要问题及发展趋势进行讨论和展望。
观看本期直播的观众朋友们可免费领取由北京超算提供的500元卡时计算资源,还有超多精美周边礼品等你来拿哦!赶紧预约起来吧!

特邀嘉宾
金连文,华南理工大学二级教授,目前兼任中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会副理事长、CSIG-CV、CAAI-PR和CAA-PRMI专委会常务委员等职。
主要研究领域为光学文字识别、文档图像理解、手写文字分析与识别、计算机视觉及应用等,在国内外权威期刊及重要国际会议上发表论文200余篇,其中CCF A+SCI Q1论文100余篇,Google Scholar 论文被引用数11000余次、H指数54,部分研究成果在工业界得到规模化应用。先后荣获省部级科技奖5项(其中一等奖2项、二等奖3项),中国人工智能学会、中国图象图形学学会、中国电子学会科技进步二等奖各1次;指导学生荣获国际国内权威学术竞赛冠军20余次。
分享内容
- 面向OCR的数据增广与数据合成技术
- 弱监督手写文本行/手写篇幅文档识别方法
- 基于Transformer的弱监督端到端场景文本识别
- 自监督文字识别新方法新进展介绍
- 应用演示(Optional)
特邀主持
MMOCR 负责人:GT ,德克萨斯大学奥斯汀分校计算机硕士,曾在 UT ML Lab, CLOVA AI Lab 等机构研究和实习,并在 ICLR 等会议发表论文。主要研究方向为 OCR 及多模态 NLP。
直播预约
直播时间
2023年 2 月 23日(本周四)
20: 00 - 21: 00

识别上方二维码填写表单预约直播,即可免费领取 500 元卡时高性能计算资源。
直播期间,在 OpenMMLab 视频号/B 站或北京超算视频号/B 站 参与弹幕讨论,小助手将在每平台抽取 2 名同学送出 OpenMMLab 精美周边 or 北京超算惊喜礼品【交流群内联系小助手领取奖品哦~】。

为了方便大家交流沟通,我们还建立了以【AI 奇妙夜】为主题的社群,直播相关的所有资料都将在群里分享,还能与大佬 1v1对话,期待你的加入!

栏目介绍
追踪社会热点,解读 AI 前沿,用开源的算法,促进 AI 知识渗透,以超算/高性能计算为原点,开启人工智能前沿应用视角。北京超级云计算中心联合计算机视觉开源社区 OpenMMLab ,共同发布直播栏目【AI 奇妙夜】,作为「超级云讲堂」的特别栏目,每月一期周四晚八点,陪大家一同打开 AI 领域的奇妙之门。
活动组织方
指导单位:中国计算机学会高性能计算专业委员会、北京市科学技术协会
主办单位:北京超级云计算中心、OpenMMLab
协办单位:中国图象图形学学会、北京图象图形学学会