近日,中国图象图形学学会(CSIG)公布了2021年度自然科学奖、技术发明奖、科技进步奖评选结果。其中,合合信息牵头与华南理工大学共同完成的“复杂场景文档图像识别与理解关键技术及应用”荣获2021年度中国图象图形学学会科技进步奖二等奖。
中国图象图形学学会是经民政部批准成立的国家一级学会,由中国从事图像图形学基础理论与应用研究,软、硬件技术开发及应用推广的专家学者和相关科技工作者组成。CSIG科技进步奖旨在授予在我国图像图形学领域应用推广先进科学技术成果,完成重大科学技术工程、计划、项目等方面,做出突出贡献的个人和团队。
据悉,此次成果奖项评选需满足三方面条件,包括技术创新性突出,经济效益或者社会效益显著和推动行业科技进步作用明显。
项目的技术创新性体现在针对复杂场景中文字方向多样和形状弯曲、字体风格多样和书写潦草、复杂场景下拍摄文档图像形变、背景干扰等情况下的文字识别和理解等难题,项目组提出了多项创新方法及技术,显著提升了复杂场景文字识别与理解的性能和效果。与此同时,该项目在研发过程中,共获得发明专利授权 82项(其中国际专利授权26项),计算机软件著作权30项,发表 IEEE TPAMI、IJCV、CVPR 等高水平学术论文20余篇,近四年获得 ICDAR 国际组织主办的扫描票据文字检测等权威竞赛冠军 10 余次。
另外值得一提的是,9月16日,中国图象图形学学会组织了该项目的科技成果鉴定会,鉴定委员会认为,该项目在复杂场景文档图像识别与理解技术方面取得了创造性的成果,并具有自主知识产权,整体技术达到国际先进水平,其中票据文字检测识别、图表信息抽取和自然场景文字识别技术达到国际领先水平。
据了解,鉴定委员会主任委员由中国工程院院士、中国图象图形学学会理事长、机器人视觉感知与控制技术国家工程实验室主任王耀南教授担任,副主任委员由IEEE Fellow、上海交通大学人工智能研究院常务副院长、人工智能教育部重点实验室主任杨小康教授担任,委员由南京信息工程大学计算机学院院长刘青山教授,IEEE Fellow、上海科技大学副教务长、信息学院院长虞晶怡教授,中国图象图形学学会副理事长、秘书长、北京科技大学人工智能研究院副院长马惠敏教授,华东师范大学通信与电子工程学院院长吕岳教授,北京交通大学赵耀教授,北京大学彭宇新教授,IEEE Fellow、电子科技大学朱策教授担任。
项目的相关核心技术也在合合信息多个C端产品和B端业务中实现了规模化的应用,其中名片全能王、扫描全能王等C端产品在 Apple App Store 与 Google Play 应用市场的全球用户首次下载量超过6亿次,B端业务方面,研发了票据机器人,合同机器人,财报机器人等产品和行业解决方案目前已为银行、保险、证券、物流、制造、地产等近30个行业提供服务,产生了显著的经济和社会效益。
在推动行业进步方面,此次技术相关成果推动了人工智能在金融、保险、新零售、物流、制造业、地产等行业的创新应用,对行业的技术进步和产业结构优化升级起到了重要作用,提升了我国人工智能OCR技术的产业化能力及全球规模化应用能力,显著增强各行业运营效率,具有非常好的产业化示范应用及带动效应。