企业级AI应用开发专业套件 ModelArts Pro-选择数据:新建数据集

时间:2023-11-01 16:18:44

新建数据集

“数据选择”页面,单击“新建数据集”,右侧弹出“新建数据集”页面,根据数据存储位置和数据标注情况,按表1填写数据集基本信息,然后单击“确定”

图1 新建数据集
表1 新建数据集参数说明

参数

说明

数据集名称

待新建的数据集名称。

描述

数据集简要描述。

数据集状态

上传的训练数据可以是已标注的数据,也可以是未标注的数据。

您可以根据自身业务选择“数据集状态”“已标注数据集”还是“未标注数据集”

数据集模板可在选择“数据集状态”后,单击下方的“文本分类已标注数据模板”“文本分类未标注数据模板”,下载数据集模板至本地查看。

数据集输入位置

训练数据存储至OBS的位置。

单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

数据集输出位置

待新建的数据集存储至OBS的位置。

单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

说明:

“数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。

新建数据集后,勾选当前应用开发所需的训练数据集。

由于模型训练过程需要有标签的数据,如果您上传的是已标注数据,上传后可查看标签解析。如果您想手动修改标签,可单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动修改标注数据,详细的操作指导请参考标注数据-文本分类

如果您上传的是未标注数据,您单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据-文本分类

support.huaweicloud.com/usermanual-modelartspro/modelartspro_01_0044.html