AI开发平台ModelArts-TF-IDF:参数说明

时间:2023-11-01 16:20:21

参数说明

参数

子参数

参数说明

text_col

-

文本列所在的列名,默认为"text_col"

tokenizer_col

-

对数据集文本列分词之后的结果列名,默认为"tokenizer_col"

tf_col

-

对数据集应用HashingTF之后的结果列名,默认为"tf_col"

idf_col

-

对数据集应用IDF之后的结果列名,默认为"idf_col"

tf_binary

-

默认为False

tf_num_features

-

HashingTF中的特征个数

idf_min_doc_freq

-

最小文档频率,默认为0

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0130.html