AI开发平台MODELARTS-数据去冗余:输入要求

时间:2023-12-15 17:32:44

输入要求

算子输入分为两种,“数据集”“OBS目录”

  • 选择“数据集”,请从下拉框中选择ModelArts中管理的数据集及其版本。要求数据集类型与您在本任务中选择的场景类别一致。
  • 选择“OBS目录”,存放结构又分两种情况,“仅包含图片”“包含图片和标注信息”
    • “仅包含图片”:当目录下全是图片时,支持jpg、jpeg、png、bmp格式,嵌套子目录的图片也将全部读入。
    • “包含图片和标注信息”:根据不同数据类型,结构不同。

      图像分类,其目录结构如下所示。如下目录结构,仅支持单标签场景。

      input_path/
          --label1/
              ----1.jpg
          --label2/
              ----2.jpg
          --../

      物体检测,其目录结构如下所示。支持jpg、jpeg、png、bmp格式的图片,xml为标准的PACAL VOC格式标注文件。

      input_path/
          --1.jpg
          --1.xml
          --2.jpg
          --2.xml
          ...
support.huaweicloud.com/dataprocess-modelarts/toctopics/zh-cn_topic_0000001512706989.html