文字语音识别教程,免费OCR试用

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


华为云OCR产品优势


识别精度高

华为云文字识别OCR采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化

稳定服务

华为云OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

支持复杂场景

华为云文字识别OCR证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景

简单易用

华为云文字识别OCR提供符合RESTful规范的API访问接口,兼容性强,使用方便

华为云文字识别产品列表

华为云文字识别产品列表

  • 通用类OCR(General OCR):

    ●通用类OCR支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化

  • 证件类OCR(Card OCR):

    ●证件类OCR支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取

  • 票据类OCR(Receipt OCR):

    ●票据类OCR支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

  • 行业类文字识别(Domain OCR):

    ●行业类文字识别支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升

  • 文字识别功能与试用:

    ●文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。

    ●在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。

    ●开通OCR后,默认按API调用次数进行收费。API使用指导请参见使用流程简介。

展开内容
收起内容

文字语音识别常见问题

文字语音识别相关推荐

图像识别 Image

图像识别(Image Recognition),基于深度学习技术,可准确识别图像中的视觉内容,提供多种物体、场景和概念标签,具备目标检测和属性识别等能力,帮助客户准确识别和理解图像内容

一句话识别

短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

文字语音识别使用必看文档

  • 什么是文字识别

    文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。

    文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。

  • 通用类文字识别功能介绍

    通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

    通用表格识别提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

  • 智能分类文字识别

    智能分类识别服务可以一次性对同张图片中的多个卡证、票据识别,并返回每个卡证、票据的类别及结构化数据。智能分类识别服务应用在身份认证、财务报销等多种场景。

    智能分类识别服务可以一次性对同张图片中的多个卡证、票据识别,并返回每个卡证、票据的类别及结构化数据。智能分类识别服务应用在身份认证、财务报销等多种场景。

  • 证件类文字识别

    自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

    自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

  • 票据类文字识别

    通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,节省大量的人工录入成本。

    通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,节省大量的人工录入成本。

  • 文字识别计费项和计费模式

    文字识别提供两种计费模式:按需计费,套餐包计费。按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。套餐包计费:相比“按需计费”具有更大折扣。

    文字识别提供两种计费模式:按需计费,套餐包计费。按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。套餐包计费:相比“按需计费”具有更大折扣。

  • 什么是语音交互服务

    语音交互服务是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本

    语音交互服务是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本

  • 实时语音识别功能介绍

    实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。

    实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。

  • 语音交互服务使用简介

    如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。

    如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。

文字语音识别操作指导教程

文字识别 OCR使用API

03:04

文字识别 OCR使用API

文字识别OCR使用SDK

06:38

文字识别OCR使用SDK