AI开发平台ModelArts-字符串相似度:参数说明

时间:2023-11-01 16:20:20

参数说明

参数名

参数类型

是否必选

参数含义

默认值

inputSelectedColName1

String

输入表被选第一个字段名称

inputSelectedColName2

String

输入表被选第二个字段名称

inputAppendColNamesStr

String

输入表添加的其他字段名称,涉及多个字段以逗号分隔

inputAppendRenameColNamesStr

String

输入表添加的其他需要rename字段映射关系

colName1:colReName1,colName2:colReName2

outputColName

String

输出的字段名称

distance

method

String

字符串相似度计算方法levenshtein,levenshtein_sim,lcs,lcs_sim,cosine,hash_jaccard_sim

cosine

lambda

Double

SSK需要的参数

0.5

k

Int

SSK需要的参数

10

kVec

Int

SimHashHamming字符向量的大小

64

b

Int

minhash分桶大小

10

seed

Int

minhash随机hash函数的种子

0

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0273.html