手写识别api_识别图片文字api_文字识别api_调用

手写文字识别API

功能介绍

识别文档中的手写文字、印刷文字信息，并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。

识别文档中的手写文字、印刷文字信息，并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。
调试

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。
前提条件

在使用之前，需要您完成服务申请和认证鉴权，具体操作流程请参见开通服务和认证鉴权章节。

说明：用户首次使用需要先申请开通。服务只需要开通一次即可，后面使用时无需再次申请。如未开通服务，调用服务时会提示ModelArts.4204报错，请在调用服务前先进入控制台开通服务，并注意开通服务区域与调用服务的区域保持一致。

在使用之前，需要您完成服务申请和认证鉴权，具体操作流程请参见开通服务和认证鉴权章节。

说明：用户首次使用需要先申请开通。服务只需要开通一次即可，后面使用时无需再次申请。如未开通服务，调用服务时会提示ModelArts.4204报错，请在调用服务前先进入控制台开通服务，并注意开通服务区域与调用服务的区域保持一致。

图像识别API

图像识别服务所提供的API为自研API。通过使用图像识别服务的自研API，您可以完整的使用图像识别服务的如下表所示功能。

API	说明
图像标签（V2.0）	图像标签服务准确识别自然图片中数百种场景、上千种通用物体及其属性，让智能相册管理、照片检索和分类、基于场景内容或者物体的广告推荐等功能更加直观。
名人识别	名人识别服务能分析并识别图片中包含的明星及网红人物，返回人物信息及人脸坐标。

识别图片文字API

功能介绍

识别网络图片中的文字内容，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。

识别网络图片中的文字内容，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。
调试

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。
前提条件

在使用之前，需要您完成服务申请和认证鉴权，具体操作流程请参见开通服务和认证鉴权章节。

说明：用户首次使用需要先申请开通。服务只需要开通一次即可，后面使用时无需再次申请。如未开通服务，调用服务时会提示ModelArts.4204报错，请在调用服务前先进入控制台开通服务，并注意开通服务区域与调用服务的区域保持一致。

在使用之前，需要您完成服务申请和认证鉴权，具体操作流程请参见开通服务和认证鉴权章节。

说明：用户首次使用需要先申请开通。服务只需要开通一次即可，后面使用时无需再次申请。如未开通服务，调用服务时会提示ModelArts.4204报错，请在调用服务前先进入控制台开通服务，并注意开通服务区域与调用服务的区域保持一致。

文字识别API使用类常见问题解答

如何查看文字识别API的使用量？

1、登录文字识别管理控制台。
2、在左侧导航栏中选择“服务监控”，查看API的使用量。
文字识别API是否可以混用？

不建议混用，例如有专门的身份证识别，就不建议使用“通用文字识别”识别身份证图片，不同接口底层算法不同，混用会导致识别效果差。
文字识别OCR服务识别结果可以转化为Word、TXT、pdf吗？

文字识别OCR提取之后返回的结果是JSON格式，需要用户通过编程，将结果保存为Word、TXT、pdf格式。
文字识别OCR的并发是多少？

文字识别服务属于公有云服务，线上用户资源共享，并发量会根据线上用户的调用情况动态调整。
如遇到突发高峰导致的并发量不够用的情况，您可以尝试以下两种解决方法：
· 通过重试机制，在代码里检查返回值，碰到并发错误可以延时一小段时间（如2-5s）重试请求.
· 后端检查上一个请求结果，上一个请求返回之后再发送下一个请求，避免请求过于频繁。
如果需要更大的并发需求，尤其是常态性的持续多并发需求，请通过华为云客服联系我们。详细描述您的使用场景和并发需求。
如何提高识别速度？

识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。
根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。
为什么文字识别API实际调用次数与界面记录次数不一致？

文字识别OCR控制台只记录服务调用成功的次数，调用失败的次数不计算在使用量内。
请参照如下操作查看调用失败的次数：
1、登录管理控制台。
2、在控制台首页选择“文字识别”，进入“文字识别”界面。
3、选择对应的服务（如：“智能分类识别”），单击“查看监控数据”，进入云监控控制台查看服务调用成功和失败的次数等具体信息。
文字识别OCR服务支持批量识别吗？

文字识别OCR服务只支持调用一次接口识别一张图片，批量识别需要进行二次开发，编码循环调用API，实现批量调用服务识别图片。
如何提高文字识别精度？

1、尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。
2、若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。
3、图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平 5:1 内（具体请以各个服务API文档为准）。
识别身份证正反面总计调用几次API接口？

使用身份证识别时，如果要识别身份证的正面和反面，需要您调用两次身份证识别接口，具体请参见身份证识别章节。
调用文字识别OCR服务的区域可以与OBS资源的区域不一致吗？

不支持跨区域OBS，OBS的区域需要和调用服务区域保持一致。

对于开启公共读授权的OBS资源公网可访问，可支持跨区域调用，虽然使用比较方便，但若对于敏感的信息，例如个人的私有数据，存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。

文字识别OCR服务如何计费

文字识别OCR按API调用次数进行收费。只有调用成功（返回2xx状态码）才会计算调用次数。
计费方式分为按需计费和套餐包计费两种。
按需计费
文字识别OCR服务开通后，默认为按需计费（按API调用次数计费）。具体计费价格、计费规则请参见文字识别价格详情。
套餐包计费
调用量大、长期使用文字识别OCR服务，建议购买套餐包。套餐包相比按需计费有更大折扣力度。具体计费价格请参见文字识别价格详情。
购买套餐包后，扣费时，优先在套餐包内进行抵扣。超出套餐包额度，自动转回按需计费方式。