AI开发平台ModelArts-NGram Count:输入参数说明

时间:2023-11-01 16:20:20

输入参数说明

参数名称

参数说明

参数要求

input_words_col_name

分词列,即进行ngram分词处理的列

string类型;必填;仅支持单列

input_words_sep

分词列中的词分隔符

string类型;必填;默认为" "

input_weight_col_name

分词行权重

string类型;表列为数值类型;非必填;

vocab_words_col_name

词袋词汇表的词汇列列名

string类型;若词袋表不为空,此项为必填

count_gram_col_name

每个ngram短语的词个数(n),如1-gram,2-gram...,显示1-n等

string类型;表列为数值类型;若历史输出表不为空,此项为必填

count_word_col_name

ngram短语列

string类型;若历史输出表不为空,此项为必填

count_count_col_name

ngram统计列

string类型;表列为数值类型;若历史输出表不为空,此项为必填

order

ngram最大单词个数,即n-gram的n

integer类型;必填;order范围为[1,3]

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0275.html