OCR图片识别

OCR图片识别

文字识别OCR提供在线文字识别服务,将图片、扫描件或PDF、OFD文档中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。


OCR通用文字识别

通用类OCR(General OCR),支持表格识别、文档识别、网络图片识别、手写文字识别、智能分类识别、健康码识别、核酸检测记录识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。


OCR图片识别测试

华为云为您提供免费的OCR图片识别试用服务。

展开详情

文字识别使用流程

  • 收起 展开
    开通文字识别 收起 展开

    ① 在开通文字识别OCR前,可在线体验服务功能,该方式无需编程,只需在网页端上传图片,即可体验识别效果。

    ② 在开通文字识别OCR前,需要提前注册华为云账号,并进行实名认证。

    ③ OCR服务提供的开通方式有两种,分别为按需计费和套餐包计费,用户可以任选其一进行开通服务。

    查看详情
  • 收起 展开
    准备数据 收起 展开

    ① 首先要查看数据传入的要求,受技术与成本多种因素制约,文字识别服务存在一些约束限制。

    ② 然后选择数据传入的方式,使用OCR API或SDK时,数据主要通过以下两种方法传入,分别为image和url。

    查看详情
  • 收起 展开
    调用API或SDK 收起 展开

    ①在线调试: API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。

    ② 本地调用:该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

    查看详情
  • 收起 展开
    获取识别结果 收起 展开

    ① 解读识别结果:调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。

    ② 识别结果后处理:调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。或将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。

    查看详情

文字识别的常见问题

文字识别的常见问题

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

  • 如何使用文字识别OCR服务?

    服务开通后,您可以根据以下介绍选择合适的使用方式:1、通过OCR体验馆在线调用OCR服务API。2、通过华为云API Explorer在线调用OCR服务API。3、通过可视化工具(如curl、Postman)发送请求调用OCR服务API。4、通过软件开发工具包(SDK)调用OCR服务API。

  • 文字识别如何选购合适的API?

    文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。其中票据类有增值税发票识别(增值税专用发票、增值税普通发票、增值税电子普通发票、通行费发票、卷票);定额发票、火车票、出租车发票;机动车销售发票、车辆通行费发票;飞机行程单。

  • 如何查看API的使用次数?文字识别服务支持批量识别吗?

    想要查询文字识别服务API的使用次数,可以登录文字识别管理控制台,在左侧导航栏中选择“服务监控”,查看API的使用量。文字识别服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。

  • 通用表格识别是否支持导出为excel格式?

    通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数base64.b64decode解码后保存为.xlsx文件。

  • 文字识别服务识别结果可以转化为Word、TXT、pdf吗?支持上传图片后直接导出结果吗?

    文字识别提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》

  • 文字识别如何获取图片base64编码?

    将需转码的图片拖拽至Chrome浏览器中,浏览器上显示该图片。按下“F12”,在弹出窗口中选择“Sources”,在左侧导航树中选择需要编码的图片所在路径,单击“{ } Pretty print”按钮。图片的base64编码显示在右侧界面中,如下图箭头中内容,选中图片的base64编码信息,Ctrl+A全选base64编码,Ctrl+C复制,注意不可使用鼠标右键方式进行复制,以免拷贝不全。

  • 文字识别如何提高识别精度?

    尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平 5:1 内(具体请以各个服务API文档为准)。

  • 文字识别如何提高识别速度?

    识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。

  • 使用文字识别服务,是否会保存用户数据?

    OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。具体的声明请参考隐私政策声明法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明

  • 使用文字识别服务是否必须使用华为云存储图片?

    文字识别服务支持输入图片的base64编码或图片的url路径。如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。同时,您也可以不使用华为云存储,使用公网http/https url传入图片。

文字识别服务使用指导视频

操作指导视频帮助您快速了解如何使用文字识别服务 了解更多

文字识别SDK使用指导

06:38

文字识别SDK使用指导

文字识别API使用指导

03:04

文字识别API使用指导