如何图片转文字 将图片中的文字提取出来

如何将图片中的文字提取出来

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


哪些类型图片能转成文字

通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。

票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。

行业类OCR(Domain OCR),支持医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

图片转文字 功能介绍

  • 通用表格识别

    提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

    提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

  • 网络图片识别

    自动识别网络图片内的所有文字及其对应位置信息,并能根据识别出来的结果进行联系人信息的提取,同时可供进一步的数据挖掘后处理操作。

    自动识别网络图片内的所有文字及其对应位置信息,并能根据识别出来的结果进行联系人信息的提取,同时可供进一步的数据挖掘后处理操作。

  • 身份证识别

    自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

    自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

  • 驾驶证识别

    自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。

    自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。

  • 行驶证识别

    自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码等结构化信息,在暗光、过曝光、防伪标志干扰等异常条件下均可准确识别行驶证信息。

    自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码等结构化信息,在暗光、过曝光、防伪标志干扰等异常条件下均可准确识别行驶证信息。

  • 护照识别

    针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码等。在暗光、过曝光、阴影等异常条件下均可准确识别护照信息。

    针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码等。在暗光、过曝光、阴影等异常条件下均可准确识别护照信息。

  • 营业执照识别

    识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 在暗光,倾斜、水印等异常条件下均可正常识别执照信息。

    识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 在暗光,倾斜、水印等异常条件下均可正常识别执照信息。

  • 银行卡识别

    自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。

    自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。

  • 名片识别

    自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。

    自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。

如何开通图片转文字服务

1、进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。

2、在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。

3、服务开通成功后,开通状态将显示为“已开通”。

图1 开通服务


说明:

  • OCR开通服务时,计费规则默认为“按需计费”,按需计费时,不使用OCR服务,则不收费。如果您购买了套餐包,套餐包扣减规则请参见计费说明,套餐包购买后暂不支持退款。
  • 如未开通服务,直接调用OCR API会提示ModelArts.4204报错。
  • 使用文字识别服务时,可以通过配置OBS访问权限搭配使用。服务只需要配置一次即可,后面使用时无需再次配置,详细信息请参见配置OBS访问权限章节。

图片转文字服务如何计费

图片转文字服务如何计费

  • 文字识别OCR按API调用次数进行收费。只有调用成功(返回2xx状态码)才会计算调用次数。

  • 计费方式分为按需计费和套餐包计费两种。

    按需计费

    文字识别OCR服务开通后,默认为按需计费(按API调用次数计费)。具体计费价格、计费规则请参见文字识别价格详情

    套餐包计费

    调用量大、长期使用文字识别OCR服务,建议购买套餐包。套餐包相比按需计费有更大折扣力度。具体计费价格请参见文字识别价格详情

  • 购买套餐包后,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,自动转回按需计费方式。

展开内容
收起内容

图片转文字使用的常见问题

图片转文字使用的常见问题

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

  • 图片转文字OCR识别中,哪些算有效计费?

    1、OCR服务通过RestFul API调用,计费以Https请求返回的状态码为准,当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。

    2、OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。

    3、在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量提升同时识别准确率。

    4、由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。

  • 图片转文字服务支持批量识别吗?

    OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。

  • 图片转文字服务识别结果可以转化为Word、TXT、pdf吗?

    OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。

  • 是否支持从非华为云存储中读取图片?

    OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。

  • 图片转文字服务识别身份证正反面总计调用几次接口?

    使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。

  • 调用OCR服务的区域可以与OBS资源的区域不一致吗?

    不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。

    对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。

  • 图片质量类报错处理办法

    问题现象:

    调用文字识别API时,产生以下图片质量类报错。

    错误码AIS.0102:图片格式不支持。

    错误码AIS.0103:图片尺寸不满足要求。

    错误码AIS.0104:非支持的图片类型或图片质量差。

    解决方法:

    请参考使用限制检查图片的格式、像素是否符合规范。

    请检查图片的base64编码是否完整。

    请检查图片质量,图片中文字是否清晰,肉眼可识别。

    请检查API功能是否和输入的图片匹配。

  • 使用图片转文字服务需要的权限

    使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。

    OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。

  • 使用图片转文字服务,是否会保存用户数据

    1、OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。

    2、OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。

  • OCR服务支持上传图片后直接导出结果吗?

    目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》

图片转文字实用文档下载

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

爆款云服务器和云产品限时领取免费体验,每位新用户仅限一次

立即体验