网络智能体-数据探索:特征分析(ACE)
特征分析(ACE)
ACE(Alternating Conditional Expectation)是一种在回归分析中寻找响应变量Y(标签)与预测变量X(特征)之间最佳转换的算法,这些(转换后的)预测变量和(转换后的)响应变量之间产生最大的线性效应。ACE分析只支持回归类任务。
- 在JupyterLab环境编辑区域,“选择数据”代码框下方单击“数据探索”。
- 选择“特征分析”页签。
- 在左侧目录树上单击“ACE”。
- 设置“标签列”、“列名”、“特征列变换初始化方法”等参数,具体参数说明如表3所示。
表3 参数说明 参数
参数说明
标签列
响应变量,单击“
”选择标签列,仅支持单列选择。
列名
预测变量,单击“
”选择列名,支持多列选择。
特征列变换初始化方法
ACE分析时,特征列的初始化方式,支持如下特征列变换初始化方法:
标签列变换初始化方法
ACE分析时,标签列的初始化方式,支持如下标签列变换初始化方法:
- zero-mean
- std
迭代误差容忍度
迭代终止条件,当迭代误差达到“迭代误差容忍度”值时,终止迭代。默认值为“0.001”。
最大迭代次数
迭代终止条件,当迭代次数达到“最大迭代次数”时,终止迭代。默认值为“100”。
“迭代误差容忍度”和“最大迭代次数”无论哪个先满足,迭代都会终止。
近邻样本数
算法迭代过程中,需要求解到每个点的近邻数量,默认值为“100”。
是否使用kd-tree
是否使用k-维树来搜索近邻数。k-维树是一种分割k维数据空间的数据结构。
提交分析请求。
提交分析任务至分析完成期间,可单击此按钮终止分析任务。
截取ACE分析图。用户可以另存图片至本地使用。
清空界面上ACE分析截图。
- 单击“分析”。
分析完成后右侧展示分析结果图,可单击“保存至特征工程”将分析结果图保存到JupyterLab环境编辑区域。