已找到关于"云端深度学习训练平台"的 10000 条记录
  • 自动学习使用子账号单击开始训练出现错误Modelarts.0010 - AI开发平台ModelArts

    自动学习使用子账号单击开始训练出现错误Modelarts.0010 用主账号给子账号配置ModelArts所使用的OBS桶的ACL权限即可。 父主题: 模型训练

  • 创建训练作业 - AI开发平台ModelArts

    (可选)设置标签:如果需要对训练作业进行资源分组管理,可以设置标签。 后续操作。 进入创建训练作业页面 登录ModelArts管理控制台。 在左侧导航栏中,选择“训练管理 > 训练作业”进入训练作业列表。 单击“创建训练作业”,进入创建训练作业页面。 配置训练作业基本信息 在创建训练作业页面填写训练作业基本信息。

  • 浅谈深度学习中的混合精度训练

    浅谈深度学习中的混合精度训练 大家好,本次博客为大家介绍一下深度学习中的混合精度训练,并通过代码实战的方式为大家讲解实际应用的理论,并对模型进行测试。 1 混合精度训练 混合精度训练最初是在论文Mixed Precision Training中被提出,该论文对混合精度训练进行了

    作者: 李长安
    发表时间: 2023-03-17 12:57:28
    1095
    1
  • 深度学习训练过程

    权重。自下上升的非监督学习就是从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看

    作者: QGS
    1043
    3
  • 华为云ModelArts助力AI开发平台—ModelArts SDK打通本地IDE与云端训练资源

    K,则向云端的ModelArts平台提交训练作业,并持续的获取训练日志直到训练结束。 查看训练过程 ModelArts Training Log 中会展示训练过程中的日志,同时日志也会保存在工程目录下的MA_LOG文件夹。如下图所示,左边是训练任务的状态,右边是云端训练日志的输出,本案例的训练任务需6分钟左右完成。

    作者: 华为云classroom
    发表时间: 2023-12-13 11:16:34
    15
    0
  • 深度学习训练过程

    重。 自下上升的非监督学习就是从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看

    作者: QGS
    531
    1
  • 分布式训练功能介绍 - AI开发平台ModelArts

    分布式训练功能介绍 ModelArts提供了如下能力: 丰富的官方预置镜像,满足用户的需求。 支持基于预置镜像自定义制作专属开发环境,并保存使用。 丰富的教程,帮助用户快速适配分布式训练,使用分布式训练极大减少训练时间。 分布式训练调测的能力,可在PyCharm/VSCode/J

  • 创建联邦学习工程 - 网络智能体

    创建联邦学习工程 创建工程 编辑代码(简易编辑器) 编辑代码(WebIDE) 模型训练 父主题: 模型训练

  • 训练模式选择 - AI开发平台ModelArts

    训练模式选择 如果训练作业选用的是MindSpore类引擎和Ascend资源,则ModelArts提供3种训练模式选择(普通模式、高性能模式和故障诊断模式),支持用户根据实际场景获取不同的诊断信息。 模式说明 训练作业默认设置为普通模式,普通模式的调测信息可参考查看训练作业日志。

  • 使用ModelArts云端算法设置训练参数的疑问

    在查看ModelArts AI市场 云端算法 RetinaNet_ResNet50 时,仔细看了训练参数的描述,在下图中的红框处有些疑问:1、learning_rate_strategy默认值是0.001,是否意味着训练过程刚开始会按照0.001的学习率进行学习,然后在训练过程中逐渐下降学习率?具体是什

    作者: 天桥调参师
    1230
    2
  • 训练容错检查 - AI开发平台ModelArts

    ckpt恢复中断的训练 在容错机制下,如果因为硬件问题导致训练作业重启,用户可以在代码中读取预训练模型,恢复至重启前的训练状态。用户需要在代码里加上reload ckpt的代码,使能读取训练中断前保存的预训练模型。具体请参见断点续训练和增量训练。 父主题: 训练故障自动恢复

  • 深度学习之对抗训练

    安全,这超出了本章的范围。然而,它们在正则化的背景下很有意思,因为我们可以通过对抗训练(adversarial training)减少原有独立同分布的测试集的错误率——在对抗扰动的训练集样本上训练网络 (Szegedy et al., 2014b; Goodfellow et al

    作者: 小强鼓掌
    835
    1
  • 深度学习之对抗训练

    安全,这超出了本章的范围。然而,它们在正则化的背景下很有意思,因为我们可以通过对抗训练(adversarial training)减少原有独立同分布的测试集的错误率——在对抗扰动的训练集样本上训练网络 (Szegedy et al., 2014b; Goodfellow et al

    作者: 小强鼓掌
    620
    2
  • 查询训练作业的运行指标 - AI开发平台ModelArts

    Object 会话对象,初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id,可通过创建训练作业生成的训练作业对象查询,如"job_instance.job_id",或从查询训练作业列表的响应中获得。 表2 get_job_log请求参数说明 参数 是否必选 参数类型

  • 查看训练作业详情 - AI开发平台ModelArts

    查看训练作业详情 登录ModelArts管理控制台。 在左侧导航栏中,选择“训练管理 > 训练作业”,进入“训练作业”列表。 在“训练作业”列表中,单击作业名称,进入训练作业详情页。 在训练作业详情页的左侧,可以查看此次训练作业的基本信息和算法配置的相关信息。 训练作业基本信息 表1

  • 使用基础镜像构建新的训练镜像 - AI开发平台ModelArts

    使用基础镜像构建新的训练镜像 ModelArts平台提供了Tensorflow,PyTorch,MindSpore等常用深度学习任务的基础镜像,镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时,您可以基于这些基础镜像制作一个新的镜像并进行训练。 基于训练基础镜像构建新镜像的操作步骤

  • 清除训练作业资源 - AI开发平台ModelArts

    清除训练作业资源 如果不再需要使用此训练任务,建议清除相关资源,避免产生不必要的费用。 在“训练作业”页面,“删除”运行结束的训练作业。您可以单击“操作”列的“删除”,在弹出的提示框中单击“确认”,删除对应的训练作业。 进入OBS,删除本示例使用的OBS桶及文件。 完成资源清除后

  • 终止训练作业 - AI开发平台ModelArts

    String 训练作业的id,可通过创建训练作业生成的训练作业对象查询,如"job_instance.job_id",或从查询训练作业列表的响应中获得。 表2 返回参数说明 参数 参数类型 描述 kind String 训练作业类型。默认使用job。 枚举值: job:训练作业 hetero_job:异构作业

  • 模型训练 - AI开发平台ModelArts

    和重新训练的自动迭代,以保证模型的精度损失极小。无需重新训练的低比特量化技术实现模型从高精度浮点向定点运算转换,多种压缩技术和调优技术实现模型计算量满足端、边小硬件资源下的轻量化需求,模型压缩技术在特定领域场景下实现精度损失<1%。 当训练数据量很大时,深度学习模型的训练将会非常

  • 查看训练作业日志 - AI开发平台ModelArts

    查看训练作业日志 什么是训练作业日志 普通日志说明 Ascend场景日志说明 如何查看训练作业日志 如何通过训练日志定位问题 父主题: 完成一次训练