文字识别 OCR-华为云

文字识别 OCR-创建应用:操作步骤

操作步骤在文字识别控制台左侧导航栏选择“自定义OCR”。默认进入“我的应用”页签。图1 文字识别控制台在“我的应用”页签下，单击“创建应用”。进入“创建应用”页面。图2 创建应用您也可以单击“我的工作流”，切换至“我的工作流”页签，选择工作流并单击卡片中的“创建应用”。根据业务需求填写“应用名称”、“应用负责人”和“应用描述”，仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。图3 创建应用确认信息后，单击“确认”。成功创建应用。

文字识别 OCR

文字识别 OCR-开通文字识别服务:购买套餐包开通服务

购买套餐包开通服务进入文字识别官网主页，单击“立即使用”，进入文字识别控制台。在“总览”页面，选择需要使用的服务，在操作列单击“购买套餐包”，此时的计费方式采用套餐包计费，套餐包额度用完后自动转为按需计费。图3 购买套餐包服务开通成功后，开通状态将显示为“已开通”。如果您需要调用对象存储服务（OBS）中的数据，请在开通服务页面进行服务授权。图4 OBS服务授权购买套餐包后只有调用成功才会计算调用次数，其中返回的2xx状态码表示调用成功，调用失败不计算次数。套餐包扣减规则包括计费模式、变更配置、续费、欠费类等问题请参见计费说明。如未开通服务，直接调用OCR API会提示ModelArts.4204报错。 4.服务开通后，您可以按照官方文档数据要求，调用API或SDK步骤继续完成实际服务需求。

文字识别 OCR

文字识别 OCR-开通文字识别服务:按需计费开通服务

按需计费开通服务进入文字识别官网主页，单击“立即使用”，进入文字识别控制台。在“总览”页面，选择需要使用的服务，执行开通操作，默认的计费方式采用按需计费。图1 服务开通服务开通成功后，开通状态将显示为“已开通”。如果您需要调用对象存储服务（OBS）中的数据，请在开通服务页面进行服务授权。图2 OBS服务授权 OCR服务开通后，可在控制台进行关闭。开通服务时，计费规则默认为“按需计费”。只有调用成功才会计费，其中返回的2xx状态码表示调用成功，调用失败不计费，详细的计费价格及规则请参见计费说明。如未开通服务，直接调用OCR API会提示ModelArts.4204报错。

文字识别 OCR

文字识别 OCR-识别结果后处理:提取特定字段导入Excel

提取特定字段导入Excel 本示例调用身份证识别API，并从获取到的JSON结果中，提取所需的字段，填入至Excel。前提条件开通身份证识别。参考本地调用，安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。登录访问密钥页面，获取AK、SK。可以新增访问密钥，或使用已有的访问密钥。访问密钥为credentials.csv文件，包含AK/SK信息。代码示例 # -*- coding: utf-8 -*- import base64 import xlsxwriter from huaweicloudsdkcore.auth.credentials import BasicCredentials from huaweicloudsdkocr.v1.region.ocr_region import OcrRegion from huaweicloudsdkcore.exceptions import exceptions from huaweicloudsdkocr.v1 import * from huaweicloudsdkcore.http.http_config import HttpConfig def recognize_id_card_request(): try: request = RecognizeIdCardRequest() request.body = IdCardRequestBody( image=image_base64 ) response = client.recognize_id_card(request) return response except exceptions.ClientRequestException as e: print(e.status_code) print(e.request_id) print(e.error_code) print(e.error_msg) def get_credential(): return BasicCredentials(ak, sk) def get_client(): config = HttpConfig.get_default_config() config.ignore_ssl_verification = True return OcrClient.new_builder(OcrClient) \ .with_credentials(credentials) \ .with_region(OcrRegion.CN_NORTH_4) \ .with_http_config(config) \ .build() def image_to_base64(imagepath): """ 将本地图片转化为base64编码 """ with open(imagepath, "rb") as bin_data: image_data = bin_data.read() base64_data = base64.b64encode(image_data).decode("utf-8") return base64_data def response_to_execl(save_file, data): """ :param save_file: 文件名 :param data: result data """ # 处理调用API返回的result数据 keys_list = list(data["result"].keys()) values_list = list(data["result"].values()) options = {'in_memory': True} with xlsxwriter.Workbook(save_file, options) as workbook: worksheet = workbook.add_worksheet() worksheet.set_column('A1:A20', 23) worksheet.set_column('B1:B20', 100) worksheet.write_column('A1', keys_list) worksheet.write_column('B1', values_list) workbook.close() if __name__ == '__main__': # 填写访问密钥AK、SK ak = "填写AK" sk = "填写SK" # Init Auth Info credentials = get_credential() # Create OcrClient client = get_client() image_base64 = image_to_base64(r"图片的路径，例如D:\local\test.png") # request id card service response = recognize_id_card_request().to_dict() # 数据保存在execl上 response_to_execl(r"excel路径，例如D:\local\test.xlsx", response)

文字识别 OCR 获取识别结果

文字识别 OCR-框选参照字段:基本概念

基本概念参照字段为模板图片和待识别图片中的公共文字部分，所有需要识别的图片中都要包含参照字段，且位置必须固定。套件提供了自动搜索参照字段和手动框选参照字段这两种模式。自动搜索参照字段：未手动框选任何参照字段的情况下，默认激活自动搜索参照字段模式。手动框选参照字段：若手动框选了任意参照字段，将激活手动框选模式。当识别图片的场景比较单一时，即只有一种模板，且参照字段不容易与其他文字混淆时，可以使用自动参照字段来简化模板制作过程，否则建议手动框选，详细步骤请参见操作步骤。

文字识别 OCR

文字识别 OCR-工作流介绍:工作流简介

工作流简介功能介绍支持用户自定义多个文字识别模板，通过模型分类，自动识别图片所需使用的模板，从而支持从大量不同板式图像中提取结构化信息。适用场景用户认证识别识别证件中关键信息，节省人工录入，提升效率，降低用户实名认证成本，准确快速便捷。快递单自动填写识别图片中联系人信息并自动填写快递单，减少人工输入。合同录入与审核自动提取合同结构化信息，有助快速审核。优势解决手工录入投入大、效率低、语种多等问题，提升业务效率。一键式部署，快速输出高精度结构化数据。解决单据复杂、单据板式多、语种多问题，支持自定义多个图像板式，快速适配新板式，快速接入业务。支持从多个不同板式图像中提取结构化信息。

文字识别 OCR

文字识别 OCR-工作流介绍:工作流简介

工作流简介功能介绍支持构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。适用场景用户认证识别识别证件中关键信息，节省人工录入，提升效率，降低用户实名认证成本，准确快速便捷。快递单自动填写识别图片中联系人信息并自动填写快递单，减少人工输入。合同录入与审核自动识别结构化信息与提取签名盖章区域，有助快速审核。优势解决手工录入投入大、效率低、语种多等问题，提升业务效率。一键式部署，快速输出高精度结构化数据。

文字识别 OCR

文字识别 OCR-自定义OCR介绍:工作流

工作流自定义OCR当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通过AI分类算法，自动识别图片所需使用的模板，从而支持从大量不同板式图像中提取结构化信息。

文字识别 OCR 自定义OCR

文字识别 OCR-自定义OCR介绍:使用工作流开发应用流程

使用工作流开发应用流程自定义OCR提供了单模板工作流和多模板工作流，您可以通过预置的工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。图1 使用预置工作流开发应用表1 使用工作流开发应用流程流程说明详细指导自定义OCR 根据您的实际使用需求选择自定义OCR。您可以通过查看产品文档选择所需使用的工作流。在“文字识别”控制台界面，单击左侧菜单“自定义OCR”，进入自定义OCR应用页面。创建应用基于已选择的工作流创建应用，填写应用基本信息、选择工作流。创建应用开发应用通用单模板工作流根据工作流指引，创建单模板服务，通过模板训练文字识别模型，实现单模板图像的文字信息结构化提取。通用单模板工作流多模板分类工作流根据工作流指引，创建多模板服务，通过多模板训练模板分类器和文字识别模型，实现多模板图像的文字信息结构化提取。多模板分类工作流调用API 调用指南，支持通过API调用当前模板服务。调用API

文字识别 OCR 自定义OCR

文字识别 OCR-如何查看审计日志:操作步骤

操作步骤登录云审计服务控制台。单击左侧导航树的“事件列表”，进入事件列表信息页面。事件列表支持通过筛选来查询对应的操作事件。当前事件列表支持四个维度的组合查询，详细信息如下：事件来源、资源类型和筛选类型。在下拉框中选择查询条件。其中筛选类型选择事件名称时，还需选择某个具体的事件名称。选择资源ID时，还需选择或者手动输入某个具体的资源ID。选择资源名称时，还需选择或手动输入某个具体的资源名称。操作用户：在下拉框中选择某一具体的操作用户，此操作用户指用户级别，而非租户级别。事件级别：可选项为“所有事件级别”、“normal”、“warning”、“incident”，只可选择其中一项。时间范围：可选择查询最近七天内任意时间段的操作事件。展开需要查看的事件，查看详细信息。图1 展开记录在需要查看的记录右侧，单击“查看事件”，弹窗中显示了该操作事件结构的详细信息。

文字识别 OCR 审计

文字识别 OCR-V1版本APIs切换至V2版指导:APIs切换步骤

APIs切换步骤 V1版本APIs清单请参见表1。仅支持V2版本的API不在此表中列举。在进行版本替换时，请在您的业务代码中搜索“v1.0”相关的API。例如，搜索“v1.0/ocr”找到代码中API请求地址所在的代码行。将“v1.0/ocr”替换为“/v2/{project_id}/ocr”。其中，{project_id}为项目ID，可以登录我的凭证页面获取。项目ID需要依据实际的OCR部署区域进行填写，例如在图1中，OCR部署区域为“cn-north-4”，即{project_id}填充为cn-north-4区域对应的项目ID。图1 代码示例图2 获取项目ID 表1 APIs清单名称 V1版本API V2版本API 通用表格识别 /v1.0/ocr/general-table /v2/{project_id}/ocr/general-table 通用文字识别 /v1.0/ocr/general-text /v2/{project_id}/ocr/general-text 网络图片识别 /v1.0/ocr/web-image /v2/{project_id}/ocr/web-image 智能分类识别 /v1.0/ocr/auto-classification /v2/{project_id}/ocr/auto-classification 手写文字识别 /v1.0/ocr/handwriting /v2/{project_id}/ocr/handwriting 身份证识别 /v1.0/ocr/id-card /v2/{project_id}/ocr/id-card 行驶证识别 /v1.0/ocr/vehicle-license /v2/{project_id}/ocr/vehicle-license 驾驶证识别 /v1.0/ocr/driver-license /v2/{project_id}/ocr/driver-license 护照识别 /v1.0/ocr/passport /v2/{project_id}/ocr/passport 银行卡识别 /v1.0/ocr/bankcard /v2/{project_id}/ocr/bankcard 营业执照识别 /v1.0/ocr/business-license /v2/{project_id}/ocr/business-license 车牌识别 /v1.0/ocr/license-plate /v2/{project_id}/ocr/license-plate 增值税发票识别 /v1.0/ocr/vat-invoice /v2/{project_id}/ocr/vat-invoice 出租车发票识别 /v1.0/ocr/taxi-invoice /v2/{project_id}/ocr/taxi-invoice 火车票识别 /v1.0/ocr/train-ticket /v2/{project_id}/ocr/train-ticket 定额发票识别 /v1.0/ocr/quota-invoice /v2/{project_id}/ocr/quota-invoice 车辆通信费发票识别 /v1.0/ocr/toll-invoice /v2/{project_id}/ocr/toll-invoice 飞机行程单识别 /v1.0/ocr/flight-itinerary /v2/{project_id}/ocr/flight-itinerary 道路运输证识别 /v1.0/ocr/transportation-license /v2/{project_id}/ocr/transportation-license 机动车销售发票识别 /v1.0/ocr/mvs-invoice /v2/{project_id}/ocr/mvs-invoice 名片识别 /v1.0/ocr/business-card /v2/{project_id}/ocr/business-card VIN码识别 /v1.0/ocr/vin /v2/{project_id}/ocr/vin 保险单识别 /v1.0/ocr/insurance-policy /v2/{project_id}/ocr/insurance-policy 电子面单识别 /v1.0/ocr/waybill-electronic /v2/{project_id}/ocr/waybill-electronic

文字识别 OCR

文字识别 OCR-上传模板图片:新增模板配置

新增模板配置默认进入“新增模板配置”页签。图4 新增模板配置单击添加多个模板，针对每个模板，选择模板类型，并且上传图片。 “上传图片”：单击“上传图片”区域，或鼠标直接拖拽图片至“上传图片”区域，上传本地一张图片作为模板，用于业务场景的文字结构化识别。 “修改模板名称”：单击图片右侧的，在弹出的输入框中输入新的模板名称，单击“确认”。 “删除模板”：单击图片右侧“删除”，在弹出的确认删除对话框中单击“确认”。 “语种”：单击图片右侧“语种”下拉选择框，选择模板对应的语种。不选择的情况下，默认为中英文。确认信息后，单击“下一步”，进入定义预处理步骤，对上传的模板图片进行自动旋转、裁剪等预处理。

文字识别 OCR 多模板分类工作流

文字识别 OCR-框选参照字段:基本概念

基本概念参照字段为模板图片和待识别图片中的公共文字部分，所有需要识别的图片中都要包含参照字段，且位置必须固定。套件提供了自动搜索参照字段和手动框选参照字段这两种模式。自动搜索参照字段：未手动框选任何参照字段的情况下，默认激活自动搜索参照字段模式。手动框选参照字段：若手动框选了任意参照字段，将激活手动框选模式。当识别图片的场景比较单一时，即只有一种模板，且参照字段不容易与其他文字混淆时，可以使用自动参照字段来简化模板制作过程，否则建议手动框选，详细步骤请参见操作步骤。

文字识别 OCR 通用单模板工作流

文字识别 OCR-准备工作:创建 rf_amdin_trust 委托

创建 rf_amdin_trust 委托登录统一身份认证服务（IAM）控制台。进入“委托”页面，搜索“rf_admin_trust”委托。图3 委托列表如果委托存在，则不用执行接下来的创建委托的步骤。如果委托不存在时执行接下来的步骤创建委托。单击“委托”页面的“创建委托”。在委托名称中输入“rf_admin_trust”，选择“普通账号”，委托的账号，输入“op_svc_IAC”，单击“下一步” 。图4 创建委托在搜索框中输入”Tenant Administrator”权限，并勾选搜索结果。图5 选择策略选择“所有资源”，并单击下一步完成配置。图6 设置最小授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。图7 委托列表

文字识别 OCR 实施步骤

文字识别 OCR-准备工作:给 rf_admin_trust 委托添加 IAM Agency Management FullAcces 策略

给 rf_admin_trust 委托添加 IAM Agency Management FullAcces 策略登录统一身份认证服务（IAM）控制台。进入“委托”菜单，选择rf_admin_trust委托。图11 委托列表进入“授权记录”菜单，单击“授权”按钮。图12 授权记录在搜索框输入IAM Agency Management FullAcces，勾选过滤出来的记录，单击下一步，并确认完成权限的配置。图13 配置 IAM Agency Management FullAcces 策略配置成功后：rf_admin_trust委托拥有Tenant Administrator和IAM AgencyManagement FullAccess权限。图14 授权记录列表

文字识别 OCR 实施步骤

云服务器内容精选

文字识别 OCR

7*24

备案

专业服务

退订

建议反馈

售前咨询热线