文字识别 OCR-通用表格识别:请求参数
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
是 |
String |
用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 |
Content-Type |
是 |
String |
发送的实体的MIME类型,参数值为“application/json”。 |
Enterprise-Project-Id |
否 |
String |
企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明:
创建企业项目后,在传参时,有以下三类场景。
|
参数 |
是否必选 |
类型 |
说明 |
---|---|---|---|
image |
否 |
String |
该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg...,带有多余前缀会产生The image format is not supported报错。 |
url |
否 |
String |
该参数与image二选一。图片的url路径,目前支持:
说明:
|
return_text_location |
否 |
Boolean |
返回文本块坐标及单元格坐标信息,可选值如下所示。
如果未传入该参数时默认为false,即不返回。 |
return_char_location |
否 |
Boolean |
返回单字符的坐标信息,可选值包括:
未传入该参数时默认为false,即不返回。如果此参数为true时,return_text_location必须为true |
return_confidence |
否 |
Boolean |
是否返回置信度的开关,可选值如下所示。
如果未传入该参数,系统默认为“false”,即不返回置信度。 |
return_excel |
否 |
Boolean |
是否返回表格转换Microsoft Excel的Base64编码字段。可选值包括:
对返回的Excel编码,可用Python函数 base64.b64decode解码后保存为.xlsx文件。 |
return_rectification_matrix |
否 |
Boolean |
可选值包括:
未传入该参数时默认为false,即不返回透视变换矩阵。 |
with_borders |
否 |
Boolean |
可选值包括:
未传入该参数时默认为false,即同时进行有线表格与无线表格识别。当确认输入仅包含有线表格时,该参数设为true可达到更优识别效果。 |