温馨提示
恭喜您,订阅成功!
温馨提示
抱歉,订阅失败,请稍后再试!
温馨提示
您还未绑定邮箱,需要绑定邮箱才能订阅哦!订阅成功后,订阅信息会发送到您绑定的邮箱。
温馨提示
请您在新打开的页面绑定邮箱!
注意:绑定邮箱完成前,请不要关闭此窗口!
炫科技
借机器的一双“慧眼”,让文字识别不再雾里看花

无纸化办公已经被谈论了近50年,一直不温不火。直到近几年,随着智能手机、平板电脑以及众多云计算、协同工作软件的出现,才开始真正走向主流。访问基于纸张的信息,将包含大量重要管理数据和资讯的文档以电子形式存储,之后将信息进行整合,进入数字化工作流,是无纸化办公的精髓,可以大大简化办公流程,降低运营成本,提升业务效率。在这个过程中,如何快速、精准的访问基于纸张的信息是一个关键点。因此,OCR(Optical Character Recognition)文字识别就成了至关重要的技术。

OCR可以将图片、扫描件中的文字识别成可以编辑的文本,代替人工手动录入。它就是机器的一双“慧眼”,本质上类似于人的视觉和阅读能力,把看到的画面中文字的信息识别出来,以供使用。事实上,OCR本身并非新的概念,上世纪60、70年代世界各国就开始有相关研究,但是由于硬件设备成本高、运行速度慢、输入质量要求高等限制,并未达到广泛应用的阶段。直至近几年,由于人工智能和图像识别技术的发展,基于人工智能的文字识别,效率和准确率大幅提高到可以商用的阶段。

作为每年在全球有几百万份销售订单的华为,如何快速、准确的处理数量如此庞大的单据就成为了一大诉求。有着强大技术实力的华为,自然会聚合人工智能、物联网、计算和存储等基础能力,解决类似OCR的企业智能问题。华为云AI就包含OCR文字识别服务。

挑战重重

考虑到客户和应用场景的多样性,OCR主要面临以下挑战:

1、扫描的单据往往存在虚线干扰、版面缺失、倾斜、暗光、扭曲、噪声等情况,定位难度大。

2、文字千变万化,例如字体、字号、颜色、笔画宽度等不固定,方向任意;小数点、近似英文数字、特殊符号、连接词、艺术字等,容易被漏检或误识别。

3、语言种类繁多,经常是中英文混合,多种语言混合等场景,识别难度加大。

4、表格单据经常存在盖章(印章覆盖文字)、错行(文字溢出表格单元,与表格线交叉)的情况,也造成文字识别干扰,极大影响识别准确率。

5、拍照上传的图片存在噪声、模糊、光线变化、形变、复杂背景干扰等问题,对文字定位和识别的准确度是巨大的挑战。

逐一击破

华为云OCR通过图像预处理、表单文字定位、证件文字定位与信息抽取、后处理集成学习技术,对以上挑战一一击破,并取得了明显的效果。

首先,在图像预处理技术方面,针对盖章和错行的问题,用最新的深度学习模型,直接分离文字、表格线与盖章3种目标,消除了表格线和盖章对文字的干扰,同时消除了噪声,极大简化了后续的文字识别和版面分析过程,提高了准确度。据了解,由于采用了业界先进的深度学习模型以及迁移学习模型优化技术,以及万亿级海量训练样本,华为云OCR的识别率和召回率达到了业界领先水平。

第二,在处理表单类文本识别场景时,采用倾斜矫正算法、最大轮廓提取算法、表格线去干扰算法和文字框定位算法等多种技术手段。在证件文字定位与信息抽取方面,创新性地提出“一体化检测(ITE)”检测算法,将信息抽取的部分关键工作在文字定位环节,以分类的方式完成,大幅提升了结构化数据的提取效率和准确率。为了更好地适应任意版面的旋转、扭曲、复杂背景、光照、模糊场景下的文字检测识别,采用黑边处理、自动纠偏、去噪、图像自动旋转、多种二值化等方法处理图像。这样一来,可以快速识别表格、发票等单据,并结构化输出,帮助客户快速便捷的完成纸质单据的电子化。同时也可以为客户定制各种个性化的OCR服务,满足不同客户的需求。

第三,采用词库+编辑距离+集成学习的策略,对常见词进行词典库数据收集,用编辑距离进行更正。对关键数字部分,采取多个图像后处理手段进行集成学习,给出最终结果置信度,并进行可能出错的报警。

第四,采用最新的大数据集群技术,后台服务器稳定可靠,系统毫秒级响应。

通过华为云OCR技术自动采集关键数据, 建立数据资产,并进行大数据分析,有效降低了华为的运营成本,提升了业务效率。华为云OCR技术帮助华为全球170多个子公司,节省约200位人力资源;通过分析海关估价等关键信息,控制了每年千万美金级的风险敞口,业务流程自动化比例提升了50%。

能力释放

不仅在华为内部,华为云OCR有效利用华为云计算的优势,基于松耦合、高复用性和易于维护的原则,建设了OCR公有云服务,以统一的API接口方式,对外部应用系统提供满足不同需求的、便捷的、兼容性强的OCR识别服务。

目前,华为云OCR已经成功应用在全球医疗、海关、物流、金融、保险、政务、交通、汽车、传统制造业等拥有大量信息整合输入需求的业务领域。比如,为保险公司提供保单识别、医疗单据识别,帮助保险公司提高工作效率,加快理赔的速度;在医疗领域,帮助公司识别药品说明书,帮助公司快速构建药品说明书的信息库;在物流领域,华为助力多家Top级快递企业完成各类单据自动识别,提效降本效果显著。

通过华为云OCR不难看出,华为通过人工智能、云计算、大数据等技术能力,提供创新的企业智能服务 ,必将会成为智能社会的使能者。