AMD 深度学习处理器单元 (DPU) 是一个专门用于卷积神经网络的可编程引擎。该单元包含寄存器配置模块、数据控制器模块和卷积计算模块。为 DPU 提供了一个专用指令集,其可帮助 DPU 高效服务于许多卷积神经网络。在 DPU 中部署的卷积神经网络包括 VGG、ResNet、GoogLeNet、YOLO、SSD、MobileNet 以及 FPN 等。
可将 DPU IP 作为一个模块集成到所选 Zynq™ 7000 SoC 和 Zynq UltraScale™+ MPSoC 器件的可编程逻辑 (PL) 中,这些器件与处理系统 (PS) 直接相连。要使用 DPU,您应该准备好指令,并在 DPU 可访问的特定内存地址中输入图像数据。DPU 工作还需要针对服务中断提供应用处理单元 (APU),以协调数据传输。