OCR服务能提取哪些类型图片文字?

通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

通用文字识别:提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。

手写文字识别:识别文档中的手写文字信息,并将识别的结构化结果返回给用户。

网络图片识别:自动识别网络图片内的所有文字及其对应位置信息,并能根据识别出来的结果进行联系人信息的提取,同时可供进一步的数据挖掘后处理操作。

智能分类识别自动检测定位图片上指定要识别的票证,一次扫描即可识别票证的位置坐标、结构化识别的内容以及对应的类别。

身份证识别:自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

驾驶证识别:自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。

行驶证识别:自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别行驶证信息。

护照识别:针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。

营业执照识别:识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 在暗光,倾斜、水印等异常条件下均可正常识别执照信息。

银行卡识别:自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。

道路运输证识别:自动识别道路运输证的全部信息,一次扫描即可识别业户名称、道路运输证号、车辆号牌、车辆类型等全部信息。

车牌识别:自动识别图片中的车牌信息。

名片识别:自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。

增值税发票识别:通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。

机动车销售发票识别:自动识别机动车销售发票图片内的文本内容,并返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。

飞机行程单识别:自动识别飞机行程单的全部信息,一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。

定额发票识别:自动识别定额发票的全部信息,一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。

火车票识别:自动识别火车票的全部信息,一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。

出租车发票识别:自动识别出租车发票的全部信息,一次扫描即可识别归属地区、发票代码、发票号码、电话(包括电话、监督电话)等全部信息。

车辆通行费发票识别:自动识别车辆通行费发票的全部信息,一次扫描即可识别发票代码、发票号码、入口、出口、收费金额、收费员、车辆类型、日期、时间等主要信息。

提取图片文字、图片转换文字服务使用流程

  • 收起 展开
    开通文字识别 收起 展开

    ① 在开通文字识别OCR前,可在线体验服务功能,该方式无需编程,只需在网页端上传图片,即可体验识别效果。

    ② 在开通文字识别OCR前,需要提前注册华为云账号,并进行实名认证。

    ③ OCR服务提供的开通方式有两种,分别为按需计费和套餐包计费,用户可以任选其一进行开通服务。

    查看详情
  • 收起 展开
    准备数据 收起 展开

    ① 首先要查看数据传入的要求,受技术与成本多种因素制约,文字识别服务存在一些约束限制。

    ② 然后选择数据传入的方式,使用OCR API或SDK时,数据主要通过以下两种方法传入,分别为image和url。

    查看详情
  • 收起 展开
    调用API或SDK 收起 展开

    ①在线调试: API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。

    ② 本地调用:该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

    查看详情
  • 收起 展开
    获取识别结果 收起 展开

    ① 解读识别结果:调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。

    ② 识别结果后处理:调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。或将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。

    查看详情

图片转换为文字有哪些用途

  • 通用类图片转换文字

    支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化

    支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化

  • 证件类图片转换文字

    支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取

    支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取

  • 票据类图片转换文字

    支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

    支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

提取图片文字、图片转换文字常见问题解答

提取图片文字、图片转换文字常见问题解答

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

  • 开通提取图片文字服务,如何选购合适的API?

    文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。

    1、通用类:

    通用表格识别:提取表格内的文字和所在行列位置信息。

    通用文字识别:提取图片内的文字及其对应位置信息。

    手写文字识别:识别手写文字、印刷文字信息。

    网络图片识别:识别网络图片内的所有文字及其对应位置信息。

    2、证件类:

    身份证识别、护照识别、银行卡识别

    驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别

    营业执照识别、名片识别

    3、票据类:

    增值税发票识别(增值税专用发票、增值税普通发票、增值税电子普通发票、通行费发票、卷票)

    定额发票、火车票、出租车发票

    机动车销售发票、车辆通行费发票

    飞机行程单

    4、智能分类:

    一张待识别图片中包含了卡证、发票多个内容时,进行混合识别。

    一张待识别图片中包含了多张同类型的发票。

    一张待识别图片中包含了多张不同类型的发票。

  • 购买图片转换文字服务套餐包后,为什么会出现额外的计费或欠费?

    1、套餐包额度已使用完

    套餐包额度用完后,默认会转为按需计费,当账户中余额不足时,无法对当前产生费用进行扣费,就会导致欠费。

    2、套餐包额度未使用完

    请登录费用中心检查套餐包的购买区域,与调用api的区域是否一致,套餐包不支持跨区调用。同时检查开通套餐包的API与实际调用的API是否一致。

  • 文字识别OCR服务是否支持离线使用?

    不支持离线使用,调用SDK必须能够访问公网才可以的,因为OCR接口部署在华为云云端,所以需要您的网络可以访问公网才可以调用服务接口。

  • 图片转文字服务识别身份证正反面总计调用几次接口?

    使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。

  • OCR服务可以识别文本格式文件吗?

    增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理

  • 提取图片文字服务如何提高识别速度

    识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。

    根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。

  • 提取图片文字服务如何提高识别精度

    1、尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。

    2、若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。

    3、图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平 5:1 内(具体请以各个服务API文档为准)。

  • 提取图片文字服务支持上传图片后直接导出结果吗?

    目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。

  • 图片质量类报错处理办法

    问题现象:

    调用文字识别API时,产生以下图片质量类报错。

    错误码AIS.0102:图片格式不支持。

    错误码AIS.0103:图片尺寸不满足要求。

    错误码AIS.0104:非支持的图片类型或图片质量差。

    解决方法:

    请参考使用限制检查图片的格式、像素是否符合规范。

    请检查图片的base64编码是否完整。

    请检查图片质量,图片中文字是否清晰,肉眼可识别。

    请检查API功能是否和输入的图片匹配。

  • OCR服务的SDK需要付费购买吗?

    OCR服务SDK供用户免费下载,并依据API调用次数进行收费。

提取图片文字、图片转换文字实用文档下载

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

爆款云服务器和云产品限时领取免费体验,每位新用户仅限一次

立即试用