数字视觉预处理6个模块功能及架构介绍_昇腾AI软件栈数字视觉预处理功能架构-华为云

华为云计算云知识数字视觉预处理6个模块功能及架构介绍

数字视觉预处理6个模块功能及架构介绍

时间: 2020-08-19 09:07:45

猜你想看：

实时语音识别云服务器配置 CDN是什么意思视频点播加速什么是云桌面

数字视觉预处理模块作为昇腾AI软件栈中的编解码和图像转换模块，为神经网络发挥着预处理辅助功能。当来自系统内存和网络的视频或图像数据进入昇腾AI处理器的计算资源中运算之前，由于Davinci架构对输入数据有固定的格式要求，如果数据未满足架构规定的输入格式、分辨率等要求，就需要调用数字视觉处理模块进行格式的转换，才可以进行后续的神经网络计算步骤。

数字视觉预处理模块功能架构

数字视觉预处理对外提供6个模块，分别为视频解码（VDEC）模块、视频编码（VENC）模块、JPEG解码（JPEGD）模块、JPEG编码（JPEGE）模块、PNG解码（PNGD）模块和视觉预处理（VPC）模块。

-VDEC模块提供H.264/H.265的视频解码功能，对输入的视频码流进行解码输出图像，用于视频识别等场景的前处理。

-VENC模块提供输出视频的编码功能。对于视觉预处理模块的输出数据或原始输入的YUV格式数据，视频编码模块进行编码输出H.264/H.265视频，便于直接进行视频的播放和显示。

-JPEGD模块对JPEG格式的图片进行解码，将原始输入的JPEG图片转换成YUV数据，对神经网络的推理输入数据进行预处理。

-JPEG图片处理完成后，需要用JPEGE编码模块对处理后的数据进行JPEG格式还原，用于神经网络的推理输出数据的后处理。

-当输入图片格式为PNG时，需要调用PNGD解码模块进行解码，将PNG图片以RGB格式进行数据输出给昇腾AI处理器进行推理计算。

-VPC模块提供对图片和视频其它方面的处理功能，如格式转换（例如YUV/RGB格式到YUV420格式转换）、大小缩放、裁剪等功能。

数字视觉处理（DVPP）模块的执行流程如图所示，需要由Matrix、DVPP、DVPP驱动和DVPP硬件模块共同协作完成。

昇腾AI软件栈DVPP功能架构

-位于框架最上层是Matrix，负责调度DVPP中的功能模块进行相应处理以及管理数据流。

-DVPP位于功能架构的中上层，为Matrix提供调用视频图形处理模块的编程接口，通过这些接口可以配置编解码和视觉预处理模块的相关参数。

-DVPP驱动位于功能架构的中下层，最贴近于DVPP的硬件模块，主要负责设备管理、引擎管理和引擎模组的驱动。驱动会根据DVPP下发的任务分配对应的DVPP硬件引擎，同时还对硬件模块中的寄存器进行读写，完成其他一些硬件初始化工作。

-最底层的是真实的硬件计算资源DVPP模块组，是一个独立于昇腾AI处理器中其他模块的单独专用加速器，专门负责执行与图像和视频相对应的编解码和预处理任务。

上一篇：CDN边缘节点是什么？下一篇：分布式缓存是什么

最新文章