AI开发平台ModelArts-LightGBM分类:参数说明

时间:2023-11-01 16:20:21

参数说明

参数

子参数

参数说明

input_features_str

-

输入的列名以逗号分隔组成的字符串,例如:

"column_a"

"column_a,column_b"

label_col

-

目标列

classifier_label_index_col

-

目标列经过标签编码后的新的列名,默认为"label_index"

classifier_feature_vector_col

-

算子输入的特征向量列的列名,默认为"model_features"

prediction_index_col

-

算子输出的预测label对应的标签列,默认为"prediction_index"

prediction_col

-

算子输出的预测label的列名,默认为"prediction"

probability_col

-

算子输出的概率列的列名,默认为"probability"

is_unbalance

-

数据集是否不平衡,默认为False

timeout

-

超时时间,默认为1200秒

objective

-

目标函数,支持binary,multiclass,multiclassova,默认为"binary"

max_depth

-

树的最大深度,默认为-1

num_iteration

-

迭代次数,默认为100

learning_rate

-

学习率,默认为0.1

num_leaves

-

叶子数目,默认为31

max_bin

-

最大分箱数,默认为255

bagging_fraction

-

bagging的比例,默认为1

bagging_freq

-

bagging的频率,默认为0

bagging_seed

-

bagging时的随机数种子,默认为3

early_stopping_round

-

提前结束迭代的轮数,默认为0

feature_fraction

-

特征的比例,默认为1.0

min_sum_hessian_in_leaf

-

一个叶子上最小hessian和。取值区间为[0, 1],默认为1e-3

boost_from_average

-

是否将初始分数调整为标签的平均值,以加快收敛速度,,默认为True

boosting_type

-

提升方法的提升类型。

可选值有gbdt、gbrt、rf、dartgoss,默认为"gbdt"

lambda_l1

-

L1正则化系数,默认为0.0

lambda_l2

-

L2正则化系数,,默认为0.0

num_batches

-

如果大于0,在训练中将数据集分割成不同的批次,默认为0

parallelism

-

学习树时的并行方法,支持data_parallel, voting_parallel,默认为"data_parallel"

thresholds_str

-

多分类时使用,表示每个类别对应的概率值预置的数组,字符串用逗号隔开

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0105.html