AI开发平台ModelArts-文本词向量:参数说明

时间:2023-11-01 16:20:21

参数说明

参数

是否必选

参数说明

默认值

text_col

输入数据集中文本所在列的列名

"words"

text_id

文本id列,用一个id代表文本。

"id"

result_col

结果列的列名

"result_col"

delimiter

单词间的分隔符。

" "

vector_size

向量长度

10

min_count

词出现的最小次数,低于该值的单词会被过滤。

2

num_partitions

分区数目

8

step_size

迭代优化时的步长,学习率。

0.025

max_iter

最大迭代次数

1

window_size

训练过程中的窗口大小

5

max_sentence_length

最大句子长度

1000

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0131.html