AI开发平台ModelArts-LightGBM分类:参数说明
参数说明
参数 |
子参数 |
参数说明 |
---|---|---|
input_features_str |
- |
输入的列名以逗号分隔组成的字符串,例如: "column_a" "column_a,column_b" |
label_col |
- |
目标列 |
classifier_label_index_col |
- |
目标列经过标签编码后的新的列名,默认为"label_index" |
classifier_feature_vector_col |
- |
算子输入的特征向量列的列名,默认为"model_features" |
prediction_index_col |
- |
算子输出的预测label对应的标签列,默认为"prediction_index" |
prediction_col |
- |
算子输出的预测label的列名,默认为"prediction" |
probability_col |
- |
算子输出的概率列的列名,默认为"probability" |
is_unbalance |
- |
数据集是否不平衡,默认为False |
timeout |
- |
超时时间,默认为1200秒 |
objective |
- |
目标函数,支持binary,multiclass,multiclassova,默认为"binary" |
max_depth |
- |
树的最大深度,默认为-1 |
num_iteration |
- |
迭代次数,默认为100 |
learning_rate |
- |
学习率,默认为0.1 |
num_leaves |
- |
叶子数目,默认为31 |
max_bin |
- |
最大分箱数,默认为255 |
bagging_fraction |
- |
bagging的比例,默认为1 |
bagging_freq |
- |
bagging的频率,默认为0 |
bagging_seed |
- |
bagging时的随机数种子,默认为3 |
early_stopping_round |
- |
提前结束迭代的轮数,默认为0 |
feature_fraction |
- |
特征的比例,默认为1.0 |
min_sum_hessian_in_leaf |
- |
一个叶子上最小hessian和。取值区间为[0, 1],默认为1e-3 |
boost_from_average |
- |
是否将初始分数调整为标签的平均值,以加快收敛速度,,默认为True |
boosting_type |
- |
提升方法的提升类型。 可选值有:gbdt、gbrt、rf、dart、goss,默认为"gbdt" |
lambda_l1 |
- |
L1正则化系数,默认为0.0 |
lambda_l2 |
- |
L2正则化系数,,默认为0.0 |
num_batches |
- |
如果大于0,在训练中将数据集分割成不同的批次,默认为0 |
parallelism |
- |
学习树时的并行方法,支持data_parallel, voting_parallel,默认为"data_parallel" |
thresholds_str |
- |
多分类时使用,表示每个类别对应的概率值预置的数组,字符串用逗号隔开 |