AI开发平台ModelArts-文本词向量:参数说明
参数说明
参数 |
是否必选 |
参数说明 |
默认值 |
---|---|---|---|
text_col |
是 |
输入数据集中文本所在列的列名。 |
"words" |
text_id |
是 |
文本id列,用一个id代表文本。 |
"id" |
result_col |
是 |
结果列的列名。 |
"result_col" |
delimiter |
是 |
单词间的分隔符。 |
" " |
vector_size |
是 |
向量长度。 |
10 |
min_count |
是 |
词出现的最小次数,低于该值的单词会被过滤。 |
2 |
num_partitions |
否 |
分区数目。 |
8 |
step_size |
是 |
迭代优化时的步长,学习率。 |
0.025 |
max_iter |
是 |
最大迭代次数。 |
1 |
window_size |
是 |
训练过程中的窗口大小。 |
5 |
max_sentence_length |
否 |
最大句子长度。 |
1000 |