OCR使用前须知

OCR使用前必读

OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。

OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。


用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。

OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

OCR首次使用攻略

  • 如果您是首次使用OCR的用户,建议您学习并了解如下信息:

    功能介绍

    通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别证件类文字识别票据类文字识别

    入门使用

    OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。

    使用方式

    如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》《SDK参考》获取详情。

    由浅入深学习

    您可以参考成长地图,由浅入深学习使用OCR。


    功能介绍

    通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别、证件类文字识别、票据类文字识别。

    入门使用

    OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。

    使用方式

    如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》或《SDK参考》获取详情。

    由浅入深学习

    您可以参考成长地图,由浅入深学习使用OCR。

  • 如何开始使用OCR服务

    文字识别提供了Web化的服务管理平台,即管理控制台,以及基于HTTPS请求的API管理方式。

    您可以在管理控制台申请开通文字识别服务、查看服务的调用成功和失败次数。

    文字识别以开放API的方式提供给用户,用户可以将文字识别集成到第三方系统调用API。

    具体流程如下:

    1.申请服务

    用户可通过管理控制台申请服务,具体操作请参见文字识别API参考>申请服务。

    服务只需要开通一次即可,后面使用时无需再申请。


    2.获取请求认证

    调用OCR的API有如下两种认证方式,请任选其中一种进行认证鉴权。

    Token认证:通过Token认证调用请求,具体操作请参见文字识别API参考>认证鉴权>Token认证。

    AK/SK认证:通过AK/SK加密调用请求。AK/SK认证安全性更高,具体操作请参见文字识别API参考>认证鉴权>AK/SK认证。


    3.调用API

    OCR以API的方式提供服务,具体操作请参见《文字识别API参考》。


    4.查看服务使用信息

    用户可以在OCR控制台查看服务调用成功的次数。

    用户可以在云监控查看服务调用成功的次数和失败的次数等历史数据。

    文字识别提供了Web化的服务管理平台,即管理控制台,以及基于HTTPS请求的API管理方式。

    您可以在管理控制台申请开通文字识别服务、查看服务的调用成功和失败次数。

    文字识别以开放API的方式提供给用户,用户可以将文字识别集成到第三方系统调用API。

    具体流程如下:

    1.申请服务

    用户可通过管理控制台申请服务,具体操作请参见文字识别API参考>申请服务。

    服务只需要开通一次即可,后面使用时无需再申请。


    2.获取请求认证

    调用OCR的API有如下两种认证方式,请任选其中一种进行认证鉴权。

    Token认证:通过Token认证调用请求,具体操作请参见文字识别API参考>认证鉴权>Token认证。

    AK/SK认证:通过AK/SK加密调用请求。AK/SK认证安全性更高,具体操作请参见文字识别API参考>认证鉴权>AK/SK认证。


    3.调用API

    OCR以API的方式提供服务,具体操作请参见《文字识别API参考》。


    4.查看服务使用信息

    用户可以在OCR控制台查看服务调用成功的次数。

    用户可以在云监控查看服务调用成功的次数和失败的次数等历史数据。

  • 服务开通后,您可以根据以下介绍选择合适的使用方式:

    通过OCR体验馆在线调用OCR服务API。

    如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。


    通过华为云API Explorer在线调用OCR服务API。

    如果您是开发初学者,有代码编写基础,对HTTP请求与API调用有一定的了解,想快速体验OCR服务,该方式无需编码,只需要输入相关参数,即可调用API,体验服务应用效果。


    通过可视化工具(如curl、Postman)发送请求调用OCR服务API。

    如果您是开发工程师,熟悉代码编写,熟悉HTTP请求与API调用,您可以通过postman调用、调试API。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频


    通过软件开发工具包(SDK)调用OCR服务API。

    如果您是开发工程师,熟悉代码编写,OCR服务为您提供Java、Python、Node.js等版本的SDK,方便您快速集成。使用方法请参见调用SDK实现通用表格识别,视频指导请参见SDK使用指导视频

    通过OCR体验馆在线调用OCR服务API。

    如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。


    通过华为云API Explorer在线调用OCR服务API。

    如果您是开发初学者,有代码编写基础,对HTTP请求与API调用有一定的了解,想快速体验OCR服务,该方式无需编码,只需要输入相关参数,即可调用API,体验服务应用效果。


    通过可视化工具(如curl、Postman)发送请求调用OCR服务API。

    如果您是开发工程师,熟悉代码编写,熟悉HTTP请求与API调用,您可以通过postman调用、调试API。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频


    通过软件开发工具包(SDK)调用OCR服务API。

    如果您是开发工程师,熟悉代码编写,OCR服务为您提供Java、Python、Node.js等版本的SDK,方便您快速集成。使用方法请参见调用SDK实现通用表格识别,视频指导请参见SDK使用指导视频

OCR API调用文字识别服务流程

  • 收起 展开
    步骤一:开通服务 收起 展开

    1.登录华为云文字识别服务管理控制台。

    2.选择需要使用的API,进行开通。

    查看详情
  • 收起 展开
    步骤二:配置环境 收起 展开

    1.下载并安装Postman。

    2.下载文字识别服务Postman配置文件。

    3.导入配置文件。

    查看详情
  • 收起 展开
    步骤三:Token认证鉴权 收起 展开

    Token是用户的访问令牌,承载了用户的身份、权限等信息,用户调用API接口时,需要使用Token进行鉴权。

    1.在Postman左侧导航栏中单击“get-token”配置文件。

    2.单击“Body”配置项。填写用户名、密码、账号名。

    3.单击“Send”,发送请求,获取并复制Token。

    查看详情
  • 收起 展开
    步骤四:调用服务 收起 展开

    1.在Postman左侧导航栏中单击“OCR_idcard”配置文件。

    2.登录我的凭证,获取“华北-北京四”区域的项目ID,替换配置文件URL中的{project_id}。

    3.单击“Headers”配置项。将获取的Token复制到“X-Auth-Token”值中。

    4.单击“Body”配置项,将待识别图片的base64编码填写到“image”参数中。

    5.单击“Send”,发送请求,获取调用结果。

    查看详情

OCR SDK调用文字识别服务流程

OCR使用视频教程

OCR SDK使用指导

06:38

OCR SDK使用指导

OCR API使用指导

03:04

OCR API使用指导