推荐系统 RES-策略参数说明:逻辑斯蒂回归

时间:2023-11-01 16:16:29

逻辑斯蒂回归

表31 algorithm_parameters参数说明

参数名称

是否必选

参数类型

说明

fields_feature_size_path

String

该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下,文件名称为“part-00000”,需要用户提供文件完整路径。

max_iterations

Int

模型训练的最大迭代轮数。取值范围[1,1000]。

early_stop_iterations

Int

在测试集上连续early_stop_iterations轮迭代的AUC小于当前最优AUC时,迭代停止,训练结束。取值范围[1,1000],不大于max_iterations。

initial_parameters

JSON

请参见表32,初始化相关参数。

示例:

{

“initial_method”:“normal”,“mean_value”: 0, “standard_deviation”:0.001

}

optimize_parameters

JSON

请参见表33,优化策略相关参数。

示例:

{

“type”:“adam”,

“epsilon”:1e-08,

“learning_rate”:0.001

}

regular_parameters

JSON

请参见表34,正则相关参数。

示例:

{

"l2_regularization":0.001,

"regular_loss_compute_mode":"full"

}

algorithm_specify_parameters

JSON

-

表32 initial_parameters 参数说明

参数名称

是否必选

参数类型

说明

正态分布(normal)

平均值(mean_value)

Double

正态分布的平均值。取值范围[-1,1],默认值为0。

标准差(standard_deviation)

Double

正态分布的标准差。取值范围[0, 1],默认值为0.001。

均匀分布(uniform)

最小值(min_value)

Double

均匀分布的最小值,

必须小于最大值。取值范围[-1, 0),默认值为-0.001。

最大值(max_value)

Double

均匀分布的最大值,

必须大于最小值。取值范围(0,1],默认值为0.001。

xavier

神经元的初始值权重初始化为均值为0,方差为 Var(wi)=1/nin 的均匀分布(高斯或者随机分布)。其中 nin 是该神经元的输入数目。

表33 optimize_parameters 参数说明

参数名称

是否必选

参数类型

说明

梯度下降(grad)

学习率(learning_rate)

Double

决定优化器在优化方向上前进步长的参数。取值范围(0,1],默认值为0.001。

自适应梯度(adagrad)

初始梯度累加和

(initial_accumulator_value)

Double

用来动态调整学习步长。取值范围(0,1],默认值为0.1。

学习率(learning_rate)

Double

决定优化器在优化方向上前进步长的参数。取值范围(0,1],默认值为0.001。

自适应矩估计(adam)

数值稳定常量(epsilon)

Double

为保证数值稳定而设置的一个微小常量。取值范围(0,1],默认值为1.00E-08。

学习率(learning_rate)

Double

决定优化器在优化方向上前进步长的参数。取值范围(0,1],默认值为0.001。

在线学习(ftrl)

初始梯度累加和

(initial_accumulator_value)

Double

用来动态调整学习步长。取值范围(0,1],默认值为0.1。

L1正则项系数(lambda1)

Double

叠加在模型的1范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。

L2正则项系数(lambda2)

Double

叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。

学习率(learning_rate)

Double

决定优化器在优化方向上前进步长的参数。取值范围(0,1],默认值为0.1。

表34 regular_parameters参数说明

参数名称

是否必选

参数类型

说明

L2正则项系数

(l2_regularization)

Double

叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。

正则损失计算方式

(regular_loss_compute_mode)

enum

full指针对全量参数计算,batch则仅针对当前批数据中出现的参数计算,batch模式计算速度快于full模式。默认full。

support.huaweicloud.com/api-res/res_02_0020.html