AI开发平台MODELARTS-银行存款预测(使用新版自动学习实现预测分析):步骤1:准备数据

时间:2023-12-11 20:09:28

步骤1:准备数据

本示例使用的数据集来自UCI的Machine Learning Repository,数据集介绍请参见Bank Maketing Data Set。数据集的基本信息可参见表1表2,您可以从Github获取数据集并上传至OBS中。

  1. 从gitee下载ModelArts-Lab工程,并在“ModelArts-Lab”工程中的“\ModelArts-Lab-master\official_examples\Using_ModelArts_to_Create_a_Bank_Marketing_Application\data”目录下获取训练数据文件“train.csv”
  2. “train.csv”文件上传至OBS,例如“test-modelarts/bank-marketing”。OBS上传文件的操作指导,请参见上传文件
    表1 数据源的具体字段及意义

    字段名

    含义

    类型

    描述

    attr_1

    年龄

    String

    表示客户的年龄。

    attr_2

    职业

    String

    表示客户所从事的职业。

    attr_3

    婚姻情况

    String

    表示客户是否结婚或已离异。

    attr_4

    教育情况

    String

    表示客户受教育的程度。

    attr_5

    房产情况

    String

    表示客户名下是否有房产。

    attr_6

    贷款情况

    String

    表示客户名下是否有贷款。

    attr_7

    存款情况

    String

    表示客户名下是否有存款。

    源数据中不包含表头,本案例中定义源数据的第一列至第7列名称分别为attr_1~attr_7,其中最后一列attr_7代表预测列。

    表2 数据集样本数据

    attr_1

    attr_2

    attr_3

    attr_4

    attr_5

    attr_6

    attr_7

    31

    blue-collar

    married

    secondary

    yes

    no

    no

    41

    management

    married

    tertiary

    yes

    yes

    no

    38

    technician

    single

    secondary

    yes

    no

    no

    39

    technician

    single

    secondary

    yes

    no

    yes

    39

    blue-collar

    married

    secondary

    yes

    no

    no

    39

    services

    single

    unknown

    yes

    no

    no

support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0002.html