AI开发平台MODELARTS-数据说明:支持数据简介
时间:2025-06-09 09:05:47
支持数据简介
MindSpeed-LLM、Llama-Factory框架常用数据集格式:
- alpaca格式
- sharegpt格式
- moss格式(仅支持MindSpeed-LLM)

本教程样例Alpaca数据集下载链接如下:
- 预训练(MindSpeed-LLM):train-00000-of-00001-a09b74b3ef9c3b56.parquet,数据大小:24M左右。
- 微调:alpaca_gpt4_data.json,数据大小:43.6 MB。
support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_train_590222.html