华为云首页用户手册

鲲鹏-GPU加速型:推理加速型Pi1

鲲鹏-GPU加速型:推理加速型Pi1

时间：2023-11-28 20:34:31

鲲鹏

推理加速型Pi1

概述

Pi1型弹性云服务器采用专为AI推理打造的NVIDIA Tesla P4 GPU，能够提供超强的实时推理能力。Pi1型弹性云服务器借助P4的INT8运算器，能够将推理延时降低15倍。配备硬件解码引擎，能够同时支持35路高清视频流的实时转码与推理。

规格

**表13** Pi1型弹性云服务器的规格
规格名称	vCPU	内存（GiB）	最大带宽/基准带宽（Gbps）	最大收发包能力（万PPS）	网卡多队列数	GPU	显存（GiB）	本地盘	虚拟化类型
pi1.2xlarge.4	8	32	5/1.6	40	2	1 × P4	1 × 8GiB	-	KVM
pi1.4xlarge.4	16	64	8/3.2	70	4	2 × P4	2 × 8GiB	-	KVM
pi1.8xlarge.4	32	128	10/6.5	140	8	4 × P4	4 × 8GiB	-	KVM

Pi1型弹性云服务器功能如下：

处理器：英特尔® 至强® 处理器 E5-2697 v4，主频2.3GHz，睿频3.5GHz。
支持开启/关闭超线程功能，详细内容请参见开启/关闭超线程。
支持NVIDIA Tesla P4 GPU卡，单实例最大支持4张P4 GPU卡。
提供GPU硬件直通能力。
单GPU单精度计算能力最高5.5 TFLOPS。
单GPU INT8计算能力最高22 TOPS。
单GPU提供8GiB ECC显存，带宽192GiB/s。
GPU内置硬件视频编解码引擎，能够同时进行35路高清视频解码与实时推理。

常规支持软件列表

Pi1实例主要用于GPU推理计算场景，例如图片识别、语音识别、自然语言处理等场景。

常用的软件支持列表如下：

Tensorflow、Caffe、PyTorch、MXNet等深度学习框架

使用须知

规格为pi1.2xlarge.4、pi1.4xlarge.4、pi1.8xlarge.4的Pi1型云服务器，在按需付费的模式下，关机后基础资源（包括vCPU、内存、镜像、GPU）不计费，但系统盘仍会收取容量对应的费用。如有其他绑定的产品，如云硬盘、弹性公网IP、带宽等，按各自产品的计费方法（“包年/包月”或“按需付费”）进行收费。具体请参见产品价格详情。

规格为pi1.2xlarge.4、pi1.4xlarge.4、pi1.8xlarge.4的Pi1型云服务器，在按需付费的模式下，关机后会释放资源，下次开机时如果后台资源不足，可能会导致云服务器开机失败。如果您需要长期使用该云服务器，建议保持开机状态或者选择“包年/包月”计费模式。

Pi1型弹性云服务器不支持规格变更。
Pi1型弹性云服务器当前支持如下版本的操作系统：
- Windows Server 2019 Standard 64bit
- Windows Server 2016 Standard 64bit
- CentOS 7.3 64bit
- Ubuntu Server 16.04 64bit
- Ubuntu Server 14.04 64bit
Pi1型云服务器，所在物理机发生故障时，云服务器支持自动恢复。
使用公共镜像创建的Pi1型云服务器，默认已安装Tesla驱动。
使用私有镜像创建的Pi1型云服务器，请确认在制作私有镜像时已安装Tesla驱动。如果未安装，请在云服务器创建完成后安装驱动，以实现计算加速功能。详细操作请参考安装Tesla驱动及CUDA工具包。

上一篇：鲲鹏-网络:虚拟私有云

下一篇：鲲鹏-GPU加速型:计算加速型P1

鲲鹏-GPU加速型:推理加速型Pi1

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题