AI开发平台ModelArts-TF-IDF:参数说明
参数说明
参数 |
子参数 |
参数说明 |
---|---|---|
text_col |
- |
文本列所在的列名,默认为"text_col" |
tokenizer_col |
- |
对数据集文本列分词之后的结果列名,默认为"tokenizer_col" |
tf_col |
- |
对数据集应用HashingTF之后的结果列名,默认为"tf_col" |
idf_col |
- |
对数据集应用IDF之后的结果列名,默认为"idf_col" |
tf_binary |
- |
默认为False |
tf_num_features |
- |
HashingTF中的特征个数 |
idf_min_doc_freq |
- |
最小文档频率,默认为0 |