手写文字识别API

  • 功能介绍

    识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节

    识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节

  • 调试

    您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

    您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

  • 前提条件

    在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。


    说明:用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

    在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。


    说明:用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

图像识别API

图像识别服务所提供的API为自研API。通过使用图像识别服务的自研API,您可以完整的使用图像识别服务的如下表所示功能。

API

说明

图像标签(V2.0)

图像标签服务准确识别自然图片中数百种场景、上千种通用物体及其属性,让智能相册管理、照片检索和分类、基于场景内容或者物体的广告推荐等功能更加直观。

名人识别

名人识别服务能分析并识别图片中包含的明星及网红人物,返回人物信息及人脸坐标。

识别图片文字API

  • 功能介绍

    识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。

    对于相同板式的图片,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API,详细操作请参见视频指导

    识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。

    对于相同板式的图片,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API,详细操作请参见视频指导

  • 调试

    您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

    您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

  • 前提条件

    在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。


    说明:用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

    在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务认证鉴权章节。


    说明:用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。

文字识别API使用类常见问题解答

文字识别API使用类常见问题解答

  • 如何查看文字识别API的使用量?

    1、登录文字识别管理控制台

    2、在左侧导航栏中选择“服务监控”,查看API的使用量。

  • 文字识别API是否可以混用?

    不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。

  • 文字识别OCR服务识别结果可以转化为Word、TXT、pdf吗?

    文字识别OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。

  • 文字识别OCR的并发是多少?

    文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。

    如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法:

    · 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求.

    · 后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。

    如果需要更大的并发需求,尤其是常态性的持续多并发需求,请通过华为云客服联系我们。详细描述您的使用场景和并发需求。

  • 如何提高识别速度?

    识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。

    根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。

  • 为什么文字识别API实际调用次数与界面记录次数不一致?

    文字识别OCR控制台只记录服务调用成功的次数,调用失败的次数不计算在使用量内。

    请参照如下操作查看调用失败的次数:

    1、登录管理控制台

    2、在控制台首页选择“文字识别”,进入“文字识别”界面。

    3、选择对应的服务(如:“智能分类识别”),单击“查看监控数据”,进入云监控控制台查看服务调用成功和失败的次数等具体信息。

  • 文字识别OCR服务支持批量识别吗?

    文字识别OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。

  • 如何提高文字识别精度?

    1、尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。

    2、若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。

    3、图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平 5:1 内(具体请以各个服务API文档为准)。

  • 识别身份证正反面总计调用几次API接口?

    使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。

  • 调用文字识别OCR服务的区域可以与OBS资源的区域不一致吗?

    不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。


    对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。

文字识别OCR服务如何计费

文字识别OCR服务如何计费

  • 文字识别OCR按API调用次数进行收费。只有调用成功(返回2xx状态码)才会计算调用次数。

  • 计费方式分为按需计费和套餐包计费两种。

    按需计费

    文字识别OCR服务开通后,默认为按需计费(按API调用次数计费)。具体计费价格、计费规则请参见文字识别价格详情

    套餐包计费

    调用量大、长期使用文字识别OCR服务,建议购买套餐包。套餐包相比按需计费有更大折扣力度。具体计费价格请参见文字识别价格详情

  • 购买套餐包后,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,自动转回按需计费方式。

展开内容
收起内容

文字识别OCR服务视频教程

视频指导帮助您快速了解华为云文字识别OCR服务 了解更多

文字识别 OCR 使用SDK

06:38

文字识别 OCR 使用SDK

文字识别 OCR 使用API

03:04

文字识别 OCR 使用API