华为云用户手册

  • 请求示例 使用身份证正、反面图片、人脸图片进行人证核验 POST https://{endpoint}/v2.0/ivs-standard { "meta" : { "uuid" : "user_defined" }, "data" : { "req_data" : [ { "idcard_image1" : "/9j/4AAQSkZJRgABAgEASA...", "idcard_image2" : "/9j/4AAAAABQSkZJRgABAg...", "face_image" : "/9j/4BBQSkZJRgABAgEASB..." } ] } }
  • 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String X-Auth-Token值获取方法请参见认证鉴权。 Enterprise-Project-Id 否 String 企业项目ID。IVS支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 说明: 创建企业项目后,在传参时,有以下三类场景。 携带正确的ID,正常使用IVS服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用IVS服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用IVS服务,账单的企业项目会被分类到"default"中。 表2 请求Body参数 参数 是否必选 参数类型 描述 meta 是 Meta object 请求元数据,例如表征本次请求的唯一标注uuid。 data 是 data object 请求消息的数据部分。 表3 Meta 参数 是否必选 参数类型 描述 uuid 否 String 唯一标识此次请求的ID,用户自定义,不超过64位。 表4 data 参数 是否必选 参数类型 描述 req_data 否 Array of ReqDataByIdCardImage objects 请求列表,用于支持批量调用。目前暂时只支持单个数据查询。 表5 ReqDataByIdCardImage 参数 是否必选 参数类型 描述 idcard_image1 是 String 身份证人像面图像数据,使用base64编码,要求base64编码后大小不超过4M。图像各边的像素大小在300到4000之间,支持JPG格式。 idcard_image2 否 String 身份证国徽面图像数据,使用base64编码,要求base64编码后大小不超过4M。图像各边的像素大小在300到4000之间,支持JPG格式。 face_image 是 String 现场人像图像数据,使用base64编码,要求base64编码后大小不超过4M。图像各边的像素大小在300到4000之间,支持JPG格式。 detail 否 Boolean 响应参数similarity是否详细显示,默认为false。 true表示响应中的similarity为0~1000的小数。 false表示响应中的similarity为0~100的整数。 crop 否 Boolean 是否允许对入参“face_image”进行人脸数量检测及图片裁剪,会限制存在多个人脸和不存在人脸的图片进行核验,并对图片中的人脸做精准裁剪,提高识别成功率,默认为true。 true表示允许服务对入参“face_image”进行人脸数量检测及图片裁剪。 false表示不允许服务对入参“face_image”进行人脸数量检测及图片裁剪。 说明: 如果图片在base64编码后,大小超过90K,因为该参数默认为true,对图片进行裁剪。有一定的概率,会产生IVS.0009报错,显示检测到的人脸数量为0。此时可以将参数值设置为false。
  • OCR能力 通用类 OCR 通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。 票据类 OCR 票据类OCR (Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。 行业类 OCR 行业类OCR( Domain OCR ),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。
  • 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口,将图片或扫描件中的 文字识别 成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。
  • 首次使用OCR 如果您是首次使用OCR的用户,建议您学习并了解如下信息: 功能介绍 通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别、证件类文字识别、票据类文字识别。 入门使用 OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。 使用方式 如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》或《SDK参考》获取详情。 由浅入深学习 您可以参考成长地图,由浅入深学习使用OCR。
  • 功能介绍 身份证识别 自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息。 户口本识别 自动识别居民户口本户主页及成员页,并返回部分关键字段信息。 驾驶证识别 自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息。 行驶证识别 自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息。 护照识别 针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。 营业执照识别 识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 银行卡识别 自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。 道路运输证识别 自动识别道路运输证的全部信息,一次扫描即可识别业户名称、道路运输证号、车辆号牌、车辆类型等全部信息。 车牌识别 自动识别图片中的车牌信息。 名片识别 自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。 VIN码识别 自动识别图片上的车架号信息。 泰文身份证识别 自动识别身份证上的全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。 泰国车牌识别 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。
  • 责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的 云安全 挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、 虚拟主机 和访客虚拟机的操作系统,虚拟防火墙、API网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施,包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。 图1 华为云安全责任共担模型 父主题: 安全
  • 优势 超级API 支持对各类卡证和票据的单张图像识别,也支持多种卡证票据的任意组合混贴场景的分类识别。 调用更加便捷 直接统一调用一个API即可完成对各种卡、证、票的识别,无需在调用时判断图像类型,也不用再对每种数据分别调用不同的API,降低了集成使用的复杂度。 价格更优惠 价格详情请参考OCR服务价格计算器。 降低管理难度 无需对每个API的调用量进行单独的预测,然后分别购买不同大小的套餐包。以发票报销为例,很难分别对每种发票的数量进行预估,但是依据历史情况对总的发票数量进行预测就更加容易。
  • 功能介绍 通用 表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 网络图片识别 自动识别网络图片内的所有文字及其对应位置信息,如果图片包含联系人信息,也支持联系人信息的提取,同时可供进一步的数据挖掘后处理操作。 印章识别 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。
  • APIG.0101报错处理方法 访问的API不存在或尚未在环境中发布。The API does not exist or has not been published in the environment. 请检查API的URL是否拼写正确,例如,URL中是否缺少project_id。 检查URI中的区域信息是否和开通服务的终端节点一致。 图1 开通服务的终端节点 图2 URI中的区域信息 HTTP请求方法(POST,GET等)是否正确。 具体的URI信息请在各接口的API页面查看。 父主题: 错误码类
  • 无编程访问权限 调用API时,出现"code":403,"message":"This user only supports console access, not programmatic access."表示用户没有编程访问权限。 子用户没有编程访问权限,需要联系主账户进行权限设置。 主账户在 统一身份认证 服务界面,选择对应的子用户操作列的“安全设置”进入设置界面。 图1 编程访问权限设置 父主题: Token认证鉴权类
  • 不同区域是否有时延 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题。 父主题: 区域与可用区
  • ModelArts.0212报错处理方法 调用API时出现{"error_code":"ModelArts.0212","error_msg":"Invalid Token header. The Token not contain project item. "},表示Token无效,Token中缺少project信息。 OCR服务为项目级别服务, 获取Token 接口中,需填写scope参数,并设置为project,例如填写为cn-north-4,获取到北京四区域的Token。 父主题: 错误码类
  • 使用OCR服务是否必须使用华为 云存储 图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云 对象存储服务 (OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 同时,您也可以不使用华为云存储,使用公网http/https url传入图片。 父主题: 产品咨询类
  • APIG.0307报错处理方法 如果调用API时返回错误信息与错误码:"error_msg":"The token must be updated.","error_code":"APIG.0307",是因为Token失效,需要进行更新。 您可以尝试以下方案进行解决。 Token有效期为24小时,请使用重新获取Token调用API。 检查接口URL中的终端节点是否填写正确。部署在不同区域间的服务,不可以跨区域调用。如果调用了不同区域的接口,导致判断为Token失效,显示APIG.0307错误码。 父主题: 错误码类
  • APIG.0201报错处理方法 如果调用API时返回错误信息与错误码:"error_msg":"Backend timeout.","error_code":"APIG.0201",表示请求超时。 您可以尝试以下方案进行解决。 使用Postman等工具直接调用服务,查看是否成功,如果调用成功表示服务接口没有问题,请执行如下步骤1和步骤2进行检查: 请检查原调用请求是否过于频繁,如果是并发过大,可以通过重试机制解决,在代码里检查返回值,碰到这个并发错误可以延时一小段时间(如2-5s)重试请求;也可以后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 请检查图片是否过大,或网络延时过长,如果图片过大,在保证图片清晰度前提下可以对图片进行等比例压缩;如果网络延时较长,可以适当提升网络传输速度。 如以上方案无法解决问题,请联系我们。 父主题: 错误码类
  • ModelArts.4603、ModelArts.4704报错处理方法 如果在调用API时返回错误信息与错误码: "error_code":"ModelArts.4603","error_msg":"Obtaining the file from the URL failed. "表示从URL获取图片数据失败,可通过以下几个方面进行排查:(1)请确保提供的URL支持HTTP/HTTPS请求协议,即格式为http/https url;(2)请检查存储图片的服务器是否稳定可靠,网络连接是否有异常,是否公网可访问;(3)请检查下载图片的content-type是否为标准类型,例如:image/gif、image/jpeg、image/png、image/tiff。建议:使用OBS的URL进行请求。 "error_code":"ModelArts.4704","error_msg":"Obtaining the file from the OBS failed. "表示从OBS获取图片数据失败,请确保存储图片的OBS路径存在且可访问,如果路径存在,请确保设置OBS桶策略为公共桶。建议:不要使用跨区域的OBS路径,如果OBS与调用服务部署区域不属于用一个区域,建议本地下载图片后使用image的调用方式。 父主题: 错误码类
  • APIG.0301报错处理方法 如果在调用API时返回错误信息与错误码: "error_msg":"Incorrect IAM authentication information: decrypt token fail","error_code":"APIG.0301",是因为token解密失败。 "error_msg":"Incorrect IAM authentication information: x-auth-token not found","error_code":"APIG.0301",请求header中未添加X-Auth-Token。 "error_msg":"Incorrect IAM authentication information: token expires, expires_at: xxx","error_code":"APIG.0301",是因为Token过期。 解决方案: 请检查token是否过期。 获取token的方法,请求体信息是否填写正确,token是否正确完整。 获取token的环境与调用的环境是否一致是否跨区。 检查账号权限,是否欠费,被冻结等。 "error_msg":"Incorrect IAM authentication information: verify aksk signature fail","error_code":"APIG.0301",是因为AK/SK认证失败。 解决方案: 请检查AK/SK是否正确,AK对应的SK错误,不匹配;AK/SK中多填了空格。 AK/SK频繁出现鉴权出错,连续错误5次以上,被锁定5分钟(5分钟内,则一直认为其是异常的鉴权请求),5分钟后解锁重新认证。 检查账号权限,是否欠费,被冻结等。 父主题: 错误码类
  • Token消息体中user name,domain name和project name分别指的是什么 user name指用户名称,domain name指用户所属的账号名称。如果使用账号获取token,账号的user name和domain name相同。如果使用IAM用户获取token(账号可以创建多个IAM用户),user name和domain name不相同,user name为实际的用户名称。 project name指项目名称,如“cn-north-4”。获取方法参见获取用户名、用户ID、项目名称、项目ID。 父主题: Token认证鉴权类
  • 使用OCR服务,是否会保存用户数据 OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。 OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。 具体的声明请参考隐私政策声明和法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明。 父主题: 数据安全与隐私
  • 获取Token返回401状态码 获取Token返回401状态码有以下几种情况: Token的有效期为24小时,使用Token方式调用OCR服务返回401状态码,表示Token已经过期。建议重新获取Token调用OCR服务。 您的IAM账号的账号名与主账号的账号名一致,为了保证您的资产安全,限制了该账号下的token不可用。建议您新建一个IAM账号(不同名)授权后再进行相关操作。 近期做过更换密码、服务开通或者权限变更等操作,可能会导致Token失效。需要重新获取Token。 父主题: Token认证鉴权类
  • OCR的并发是多少 文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。 如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 如果需要更大的并发需求,尤其是常态性的持续多并发需求,请通过华为云客服联系我们。详细描述您的使用场景和并发需求。 父主题: API使用类
  • APIG.0308报错处理方法 如果调用API时返回错误信息与错误码:"error_msg":"The throttling threshold has been reached: policy user over ratelimit,limit:XX,time:1 minute","error_code":"APIG.0308",是因为每个用户调用不同服务都有并发限制,例如目前该服务并发量最大为1分钟XX次。 您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求; 后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 如果需要更大并发量请联系我们。 父主题: 错误码类
  • 使用Postman调用时,出现获取Token失败的情况 获取Token时,请依据报错信息,选择相应的解决方案。 Body体中服务所在区域是否正确, 对应的key值是否正确。 帐密报错The username or password is wrong 返回The userInfo is wrong 请正确填写username和domainname,一般情况下,username=domainname。如不确定,可登录“我的凭证”页面查看,如果使用IAM账号获取Token: username:IAM用户名(子账号名称) domainname:账号名 返回"error_code": "APIGW.0101" 请检查获取Token使用的url是否正确。以获取华北-北京四区域的token为例,采用post请求,url为: https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens 父主题: Token认证鉴权类
  • 如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:/demo.jpg", "rb") as image_file: encoded_string = base64.b64encode(image_file.read()).decode() print(encoded_string) 运行时请确保文件路径 d:/demo.jpg 是正确的,并且文件确实存在于此路径下。部分 Windows 环境下字符编码的默认设置可能与代码不兼容,导致读取后的解码报错。这种情况下可以尝试将代码中的decode()修改为decode('utf-8')来匹配适合的字符编码。 图1 运行示例 父主题: API使用类
  • ModelArts.4204报错处理方法 如果在调用API时提示"error_code":"ModelArts.4204","error_msg":"Request api error! The API XXX is not subscribed. ”,表示未开通对应服务,用户需要开通该服务。具体操作请参考申请服务。 图1 开通服务 如已开通服务,请检查开通服务的区域(或账号)与调用服务的区域(或账号)是否一致,若一致请检查API的URL是否拼写正确。 图2 检查区域信息 图3 检查账号信息 API Explorer 界面调试时,请检查调用区域与开通服务区域是否一致。 图4 检查API Explorer区域信息 父主题: 错误码类
  • 什么是区域、可用区? 我们用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 可用区(AZ,Availability Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区。
  • 如何选择区域? 选择区域时,您需要考虑以下几个因素: 地理位置 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题。 中国-香港、曼谷等其他地区和国家提供国际带宽,主要面向非中国大陆地区的用户。如果您或者您的目标用户在中国大陆,使用这些区域会有较长的访问时延,不建议使用。 在除中国大陆以外的亚太地区有业务的用户,可以选择“中国-香港”、“亚太-曼谷”或“亚太-新加坡”区域。 在非洲地区有业务的用户,可以选择“南非-约翰内斯堡”区域。 在欧洲地区有业务的用户,可以选择“欧洲-巴黎”区域。 云服务之间的关系 如果多个云服务一起搭配使用,需要注意: 不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。 不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。
  • OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务 ,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《API参考》手册,该手册详细介绍了如何调用API及各个API接口的详细参数信息。 父主题: SDK使用类
  • 步骤四:为子 域名 添加A记录集 如果要实现通过域名“www.example.com”访问网站,则为域名“example.com”的子域名添加A类型记录集。 在“公网域名”页面的域名列表的“域名”列,单击域名的名称“example.com”。 进入“解析记录”页面。 在页面右上角,单击“添加记录集”。 在“添加记录集”页面,根据界面提示为域名“example.com”设置A记录集参数。 主机记录:设置为“www”,表示解析的域名为子域名“www.example.com”。 类型:设置为A类型记录集。 值:设置为网站服务器的弹性公网IP。 其余参数取默认值,更多参数说明,请参见添加A类型记录集。 图3 设置记录集参数 单击“确定”,完成记录集的添加。 您可以在域名对应的记录集列表中查看添加的记录集。当记录集的状态显示为“正常”时,表示记录集添加成功。
共100000条