检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn

不再显示此消息

  • 中国站
    中国站
    • 简体中文
    International
    • English
    • Bahasa Indonesia
    • Español
    • Português
    • Türkçe
    • عربي
    • ไทย
    • 简体中文
    • 日本語
    Europe
    • English
    • Deutsch
    • Español
    • Français
    • Nederlands
  • 华为云App
    • 活动
    • 产品
    • 解决方案
    • 定价
    • 云商店
    • 合作伙伴
    • 开发者
    • 支持与服务
    • 了解华为云
    清空最近搜索
    热门搜索
    • 云耀云服务器L实例
    • 免费试用
    • 云服务器
    • 域名
    • 云速建站
      “”的所有结果
      • 文档
      • 备案
      • 控制台
        • 账号中心
        • 费用与成本
        • 待支付订单
        • 待续费产品
        • 未读消息
        • 工单管理
        • 管理控制台
        • 注册 登录
      • 登录
      • 注册
      • 购物车
      • admin
        • 账号中心

          未实名认证

          已实名认证

        • 费用与成本
        • 待支付订单0
        • 待续费产品0
        • 未读消息0
        • 伙伴中心
        • 云商店买家中心
        • 云商店卖家中心
        • 工单管理
        • 开发者空间
        • 个性化推荐管理
        • 管理控制台
        • admin 退出登录
      取消
      清空最近搜索
      热门搜索
      • 云耀云服务器L实例
      • 免费试用
      • 云服务器
      • 域名
      • 云速建站
      • 华为云计算
      • 云知识
      • profiling

      profiling

      api接口性能监控工具

      2023-03-30 11:35:43

      api接口性能监控工具针对基于Profiling性能分析工具的关键性能数据采集、热点函数,提供一站式分析工具,帮助用户快速定位性能瓶颈。不支持在同一个Device侧同时拉取网络。Profiling不支持多个基于相同结果目录的Profiling,可能会导致采集的数据结果不准确。比如main程序中包含多个独立推理任务,通过Profiling调用时会出现该问题。不支持在同一个Device侧同时拉起多个Profiling任务。配置Profiling相关路径时,仅支持路径由字母、数字和下划线字符组成,不支持带有特殊字符的路径。Profiling功能与Dump功能不建议同时使用,即启动Profiling前,请关闭数据Dump。原因:如果同时开启,由于Dump操作会影响系统性能,会造成Profiling采集的性能数据指标不准确。采集Profiling数据过程中如果配置的落盘路径磁盘空间已满,会出现性能数据无法落盘情况,因此,需要用户保证磁盘空间够用。另外,落盘的性能原始数据需要用户自行老化,预防磁盘空间被占满(MB/s)。落盘的性能原始数据可以通过配置storage-limit参数来预防磁盘空间被占满(<=20MB)(/s),用户将磁盘内最早的文件进行老化删除处理。

      profiling 性能 磁盘空间 原始数据 数据

      ai识字

      2023-03-28 14:01:44

      ai识字:为了改善los鲲鹏计算的性能,可获得相同性能瓶颈。在程序训练过程中,FP+FP+BP耗时占总耗时,不存在性能瓶颈。基于以上的性能数据增强可以通过更新拖尾,开启Profiling功能查看。Profiling性能分析功能与优化提供的性能数据(如bp_point+fp_point+fp_point整个链路的算子耗时具体情况)。在该文件中,着重看TaskDuration列,它记录着当前算子的耗时。可以通过表格中的自定义排序,选择TaskDuration为主要关键字,进行降序重排表格,开头部分截图如下。可见,当前网络中涉及的算子,最大耗时仅231.54us。图6op_summary从该表中依旧无法判断耗时较长的原因,那么继续打开AICore算子调用次数及耗时数据。该文件是对bp_point+fp_point整个链路上算子,不区分OPName,按算子的OPType做了统计。比如将Mul算子统计为一行,统计调用次数,总耗时,平均耗时,最大耗时,最小耗时等。通过表格中的自定义排序,选择Ratio(%)为主要关键字,进行降序重排表格,截图如下。可见,AICPU在整体耗时占比达到76.5%。通过表格中的自定义排序,选择Total_time为主要关键字,进行降序重排表格,截图如下。可以看到在AICPU中耗时最大的是dropout算子中的随机数函数,且已经达到了毫秒级别。图8aicpu到此Profiling性能分析工具的任务已经完成。问题解决查看用户脚本,发现用户脚本中的drop脚本使用的是TensorFlow的原生脚本。

      耗时 算子 profiling 性能 优化
      • 7*24

        多渠道服务支持

      • 备案

        提供免费备案服务

      • 专业服务

        云业务全流程支持

      • 退订

        享无忧退订服务

      • 建议反馈

        优化改进建议

      热门产品
      • 云服务器
      • 云速邮箱
      • 域名注册
      • 云速建站
      华为云App

      售前咨询热线

      950808转1
      • 技术服务咨询
      • 售前咨询

        sales@huaweicloud.com

      • 备案服务

        beian@huaweicloud.com

      • 云商店咨询

        partner@huaweicloud.com

      下载华为云App

      关注我们

      关注华为云

      4000 955 988

      950808

      华为云微信

      扫描二维码

      华为云微博

      扫描二维码

      华为云App

      扫描下载华为云App

      售前咨询:950808转1
      • 法律声明
      • 隐私政策

      长按/截图保存,微信识别二维码
      或者关注公众号“华为云”

      关于华为云
      了解华为云
      客户案例
      信任中心
      法律协议
      新闻报道
      华为云直播
      热门产品
      大模型即服务平台 MaaS
      Flexus云服务
      云服务器
      盘古大模型
      SSL证书
      华为云WeLink
      支持与服务
      自助服务
      服务公告
      支持计划
      盘古Doer
      联系我们
      举报中心
      实用工具
      文字识别
      漏洞扫描
      域名注册
      华为云会议
      定制建站
      云服务健康看板
      友情链接
      华为云伙伴作战营
      华为官网
      华为消费者业务
      华为开发者联盟
      华为企业业务
      华为商城
      • 法律声明
      • 隐私政策
      ©2025 Huaweicloud.com 版权所有 黔ICP备20004760号-14 苏B2-20130048号 A2.B1.B2-20070312

      增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数

      电子营业执照 贵公网安备 52990002000093号