文本校对使用简介

文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。

OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》

OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》

服务开通后,您可以根据以下介绍选择合适的使用方式:

1、通过OCR体验馆在线调用OCR服务API。

如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。

2、通过华为云API Explorer在线调用OCR服务API。

如果您是开发初学者,有代码编写基础,对HTTP请求与API调用有一定的了解,想快速体验OCR服务,该方式无需编码,只需要输入相关参数,即可调用API,体验服务应用效果。

3、通过可视化工具(如curl、Postman)发送请求调用OCR服务API。

如果您是开发工程师,熟悉代码编写,熟悉HTTP请求与API调用,您可以通过postman调用、调试API。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频

4、通过软件开发工具包(SDK)调用OCR服务API。

如果您是开发工程师,熟悉代码编写,OCR服务为您提供Java、Python、Node.js等版本的SDK,方便您快速集成。使用方法请参见调用SDK实现通用表格识别,视频指导请参见SDK使用指导视频

文本校对适用的应用场景

文本校对-疫情防控健康三码

文本校对-疫情防控健康三码

支持对全国各地区不同版式的防疫健康码、核酸检测记录、行程卡中的14个关键字段进行结构化识别;支持4种健康码颜色识别,包括:绿码、黄码、红码、灰码;支持返回各个关键字段的置信度,以便提高人工校验效率。

  • 文本校对-优势
  • 业内唯一支持同时识别三码;一个接口即可同时识别防疫健康码、核酸检测记录、行程卡等信息;采用先进的深度学习算法,优化业务场景,文字识别精度高

文本校对-合同录入与审核

文本校对-合同录入与审核

自动识别结构化信息与提取签名盖章区域,有助快速审核

  • 文本校对-优势
  • 合同一体化识别:

    自动识别合同文本,并检测签名和盖章区域,完成合同自动审核

文本校对-金融保险

文本校对-金融保险

用户申请保险报销,需提供证件、报销单、医疗单据等纸件材料。通过OCR服务可实现信息的自动录入和审核校对,提升效率。

  • 文本校对-优势
  • 识别精度高:

    采用先进的深度学习算法,优化业务场景,文字识别精度高

    支持复杂背景:

    支持盖章、错行、倾斜等场景的单据文字识别

文本校对-财务报销审核

文本校对-财务报销审核

用于公司员工发票报销,票据识别可有效节省人工录入成本,提升效率

  • 文本校对-优势
  • 支持多类别票据识别:

    支持相同类型、不同类型发票、卡证任意组合混贴场景下的文字识别

    识别精度高:

    采用先进的深度学习算法,优化业务场景,文字识别精度高

    支持复杂背景:

    支持盖章、错行、倾斜等场景的票据识别

文本校对常见问题解答

文本校对常见问题解答

文本校对必看文档

  • 文本校对功能体验与试用

    在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。开通OCR后,默认按API调用次数进行收费。API使用指导请参见使用流程简介

    在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。开通OCR后,默认按API调用次数进行收费。API使用指导请参见使用流程简介。

  • 开通文本校对服务

    进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”,此时的计费方式采用按需计费。服务开通成功后,开通状态将显示为“已开通”。

    进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”,此时的计费方式采用按需计费。服务开通成功后,开通状态将显示为“已开通”。

  • 文本校对计费说明

    本小节主要介绍文本校对服务的计费说明,提供两种计费模式:按需计费,套餐包计费。按API调用次数计费,计费价格请参见价格计算器。只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。

    本小节主要介绍文本校对服务的计费说明,提供两种计费模式:按需计费,套餐包计费。按API调用次数计费,计费价格请参见价格计算器。只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。

  • 文本校对价格和购买方式

    OCR提供两种计费方式下不同区域、不同应用场景的文字识别服务,含功能场景包括不仅限于以下类别:通用文字识别、机动车销售发票识别、行驶证识别、发票验真等数十种文字识别服务,价格表请参见文字识别价格详情

    OCR提供两种计费方式下不同区域、不同应用场景的文字识别服务,含功能场景包括不仅限于以下类别:通用文字识别、机动车销售发票识别、行驶证识别、发票验真等数十种文字识别服务,价格表请参见文字识别价格详情。

  • 文本校对准备数据

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 解读文本校对识别结果

    本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。以下图识别结果为例,讲解图片内容如何与API的返回字段对应。

    本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。以下图识别结果为例,讲解图片内容如何与API的返回字段对应。

  • 统计文本校对API使用量

    文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。

    文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。

  • 文本校对权限管理

    如果您需要对华为云上购买的OCR资源,为企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。

    如果您需要对华为云上购买的OCR资源,为企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。

  • 文本校对创建企业项目

    创建企业项目的用户必须是管理员,或在IAM侧已被授予EPS FullAccess权限的用户。企业帐号可申请开通企业项目。帐号需要进行企业实名认证。如果企业帐号注册成为华为云合作伙伴,将无法进入企业项目管理页面。

    创建企业项目的用户必须是管理员,或在IAM侧已被授予EPS FullAccess权限的用户。企业帐号可申请开通企业项目。帐号需要进行企业实名认证。如果企业帐号注册成为华为云合作伙伴,将无法进入企业项目管理页面。