文字识别 OCR

识别精准 服务稳定 简单易用

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。


OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。

文字识别 产品优势

  • 文字识别 识别精准度高

    采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化

    采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化

  • 文字识别 稳定服务

    华为云OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

    华为云OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

  • 文字识别 支持复杂场景

    证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景

    证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景

  • 文字识别 简单易用

    提供符合RESTful规范的API访问接口,兼容性强,使用方便

    提供符合RESTful规范的API访问接口,兼容性强,使用方便

文字识别 功能介绍

  • 文字识别 通用类OCR

    通用类 OCR(General OCR),支持表格识别、文档识别、网络图片识别、手写文字识别、智能分类识别、健康码识别、核酸检测记录识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

    通用类 OCR(General OCR),支持表格识别、文档识别、网络图片识别、手写文字识别、智能分类识别、健康码识别、核酸检测记录识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

  • 文字识别 证件类OCR

    证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、营业执照识别、银行卡识别、道路运输证识别、车牌识别、名片识别、VIN码识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。

    证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、营业执照识别、银行卡识别、道路运输证识别、车牌识别、名片识别、VIN码识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。

  • 文字识别 票据类OCR

    票据类OCR(Receipt OCR),支持增值税发票识别、机动车销售发票识别、出租车发票识别、火车票识别、定额发票识别、车辆通行费发票识别、飞机行程单识别以及发票验真;支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

    票据类OCR(Receipt OCR),支持增值税发票识别、机动车销售发票识别、出租车发票识别、火车票识别、定额发票识别、车辆通行费发票识别、飞机行程单识别以及发票验真;支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

  • 文字识别 行业类 Domainocr

    行业类(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别、医疗化验单据识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

    行业类(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别、医疗化验单据识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

文字识别 常见问题

文字识别 常见问题

  • 文字识别 OCR如何选购合适的API

    文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。

    除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。

  • 文字识别 OCR服务识别中,哪些算有效计费

    • OCR服务通过RestFul API调用,计费以Https请求返回的状态码为准,当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。

    • OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。

    • 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量提升同时识别准确率。

    • 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。

  • 文字识别 OCR服务中不同API的套餐包是否可以共享

    API与套餐包是一一对应关系,只能抵扣对应接口的调用次数。

    例如,您购买了身份证识别API套餐包,只能在身份证识别接口上使用,不能与其他API共用。

  • 文字识别 OCR服务中如何查看API的使用量

    1.登录文字识别管理控制台。

    2.在左侧导航栏中选择“服务监控”,查看API的使用量。

  • 文字识别 OCR的并发是多少?

    文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。

    如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法:

    • 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求.

    • 后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。

    如果需要更大的并发需求,尤其是常态性的持续多并发需求,请通过华为云客服联系我们。详细描述您的使用场景和并发需求。

  • 使用文字识别 OCR服务需要的权限

    • 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。

    • OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。

  • 什么是宽限期和保留期?

    宽限期是指客户的包周期资源到期未续订或按需资源欠费时,华为云提供给客户进行续费与充值的时间,宽限期内客户可正常访问及使用云服务。

    保留期是指宽限期到期后客户的包周期资源仍未续订或按需资源仍未缴清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。云服务进入宽限期/保留期后,华为云将会通过邮件、短信等方式向您发送提醒,提醒您续订或充值。保留期到期仍未续订或充值,存储在云服务中的数据将被删除、云服务资源将被释放。

  • 文字识别 OCR服务支持批量识别吗?

    文字识别OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。

  • 使用文字识别 OCR服务,是否会保存用户数据

    1.OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。

    2.OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。

    3.具体的声明请参考隐私政策声明法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明

  • 文字识别 OCR服务识别结果可以转化为Word、TXT、PDF吗?

    OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。