VCK5000 Versal 开发卡

发布者: AMD

AMD VCK5000 Versal 开发卡基于 AMD 7nm Versal™ 自适应 SoC 架构,专为采用 Vitis 端到端流程的 AI 引擎开发以及采用合作伙伴解决方案的 AI 推断开发而设计。 如需完整的 Vivado™ 流程和器件定制,请联系销售。

概述

产品简介

AMD VCK5000 Versal™ 开发卡采用 AMD 7nm Versal 自适应 SoC 架构,用于优化 5G、数据中心计算、AI、信号处理、雷达等应用。VCK5000 特定域架构得到了 Vitis™、Vitis AI,以及 Mipsology Zebra® 和 Aupera® VMSS 等合作伙伴解决方案的全面支持,不仅带来了强大的单位功耗性能(马力),同时还在 C/C++ 软件可编程性中保持了易用性。

与 nVidia 旗舰 GPU 相比,VCK5000 开发平台在标准 AI 基准测试中提供接近 100% 的每瓦计算效率和 2 倍的 TCO,因此是为云端应用和边缘应用实现 CNN、RNN 和 NLP 加速的理想开发平台。

在云端免费评估

AI 推断

AI 推断开发

如果您是一名 AI 开发人员,请使用 Mipsology Zebra 将 TensorFlow 和 PyTorch 训练模型直接带到 Versal 上推断并使用 Aupera 视频机器学习流媒体服务器解决方案在 FPGA 平台上构建、配置和部署计算机视觉应用。

主要特性

查看合作伙伴解决方案,阅读技术文章并获得重要特性,以便使用 VCK5000 执行 AI 推断开发

与主流 nVidia GPU 相比,TCO 降低 1 倍

  • 与支持标准 MLPerf 模型的 Nvidia Ampere 相比,性能功耗比和性价比均提升 1 倍
  • 计算效率达 90%
  • 板卡层面的功耗不足 100W

与 nVidia GPU 相比,端到端视频分析吞吐量提升 1 倍

  • 从 H.264 解码到计算机视觉再到多达 10 个 AI 模型的完整流水线
  • 视频解码和 CV 运行在 x86 CPU 或分立式 U30 Alveo 卡上
  • 来自 FFmpeg / Gstreamer 的、基于插件的流水线组合

ML 任务繁重:H.264 解码 + Yolov3 + 3x ResNet-18
视频任务繁重:H.264 解码 + tinyYolov3 + 3x ResNet-50

brand-2392-diagram_1

熟悉框架的易用性

  • 为所有 CPU 和 GPU 用户提高简单易用的软件流程,无需硬件编程
  • 直接在开发板上从 Tensorflow 框架运行推断
  • 使用主流框架 Pytorch、Tensorflow、Tensoflow 2 和 Caffe 支持业界一流的模型

合作伙伴解决方案

Mipsology Zebra 人工智能推断解决方案和 Aupera 视频机器学习流媒体服务器

Mipsology Zebra AI 推断解决方案

解决方案概述

Mipsology Zebra 软件

Zebra 将高性能与前所未有的易用性结合在一起,是 AMD 的首选 AI 加速器,可用于为基于图像的 AI 应用计算神经网络。

Zebra 可无缝替换 GPU/CPU,以更快的速度和更低的功耗计算任何基于图像的神经网络。使用 Zebra,无需重新训练您的网络或应用,也无需对其做出任何修改。Zebra 使用简单的 Linnux 命令执行部署,因此使用 Zebra,无需掌握 FPGA 知识。

  

让 Zebra 在 VMAccel® 云端免费演示 5 个小时

Aupera 智能视频分析解决方案

解决方案概述

Aupera 视频机器学习流媒体服务器解决方案

Aupera VMSS 是一个面向视频 AI 推断应用的软件框架。使用 VMSS2.0,用户无需编码,便可使用图形用户界面 (GUI) 快速构建、配置和部署计算机视觉流水线。使用 Aupera 的节点工具套件并执行解码、预处理和后处理等任务,可轻松构建自定义流水线,也可通过创建自定义节点构建该流水线,这些自定义节点可通过 GUI 上传、构建、测试和使用。

Aupera 的商用视频 AI 应用也可通过该框架配置、启动和查看。用户可选择通过视频叠加或发送文本输出来检查自定义流水线的结果。

  

让 VMSS 2.0 在 VMAccel® 云端免费演示 5 个小时

AI 推断开发技术文章


vmss-vck5000
文章

通过 AMD VMSS 和 VCK5000 平台提升视频分析

vitis-ai-108x208
Blog

Vitis AI 2.0 现已推出!

Vitis AI 2.0 现已推出!作为 AMD FPGA 及自适应 SoC 上基于软件的最全面 AI 加速解决方案,Vitis AI 将不断提高用户 AI 产品的价值和竞争力。有了该版本,Vitis AI 解决方案不仅更加简单易用,而且还可在边缘和数据中心实现进一步的性能提升。本次网络研讨会将介绍新产品的特性,包括模型、软件工具、深度学习处理单元以及最新性能信息等。 

image-1-vitis-code
文章

为什么选择 AMD 解决方案来加速您在各行业的应用?

Vitis 提供了许多开发套件和库来加速许多行业的应用,使其比传统的 FPGA 流程更容易。 对于熟悉使用 C/C++ 或 Python 开发基于 CPU/GPU 的软件开发者来说,它也是一个理想的设计环境。 Vitis 库涵盖了许多库,例如 CUDA,让您可以有效地迁移您的设计。

让我们深入探讨为什么 AMD 解决方案是加速应用的理想选择!

wego
文章

整体图形优化器 (WeGO) 概览

了解在 Vitis AI 2.0 中发布的整体图形优化器 (WeGO),其旨在提供一个流畅的解决方案,通过将 Vitis AI 开发套件与 TensorFlow 框架集成在一起,在云 DPU 上部署 TensorFlow 1.x。

VCK5000 功能演示

数据中心越来越多地采用人工智能来管理从设备监控到服务器优化的各种任务。基于 FPGA 的自适应计算在数据中心中起着核心作用,通常被证明是运行复杂 AI 工作负载的最高效、最具成本效益的解决方案。

2021 自适应计算挑战赛展示了将 VCK5000 开发卡与 Vitis AI 结合使用的最佳方式。


BRAND-2591-746x400-Medical-2
Contest 2021 第一名

用于 8 个临床检验室的即时医疗图像分析助手

该系统最多可实时并行批量处理 8 个息肉分割任务,对于加入医疗应用确实有帮助。

BRAND-2591-746x400-Image-Restore
Contest 2021 二等奖

绿色计算:基于 Versal 的图像恢复管道

Vitis AI 2.0 现已推出!作为 AMD FPGA 及自适应 SoC 上基于软件的最全面 AI 加速解决方案,Vitis AI 将不断提高用户 AI 产品的价值和竞争力。有了该版本,Vitis AI 解决方案不仅更加简单易用,而且还可在边缘和数据中心实现进一步的性能提升。本次网络研讨会将介绍新产品的特性,包括模型、软件工具、深度学习处理单元以及最新性能信息等。

BRAND-2591-746x400-Deepfake
Contest 2021 三等奖

VCK5000 上的 Deepfakes C-L-I

Vitis 提供了许多开发套件和库来加速许多行业的应用,使其比传统的 FPGA 流程更容易。 对于熟悉使用 C/C++ 或 Python 开发基于 CPU/GPU 的软件开发者来说,它也是一个理想的设计环境。 Vitis 库涵盖了许多库,例如 CUDA,让您可以有效地迁移您的设计。

让我们深入探讨为什么 AMD 解决方案是加速应用的理想选择!

AI 引擎

AI 引擎开发

如果您想使用 AI 引擎和可编程逻辑实现算法加速,我们提供 AI引擎 C/C++ 高层次抽象 APIVitis 加速库。Vitis 端到端流程使用 C/C++ 开发,在 X86 或嵌入式处理器上运行,并通过 XRT 管理与加速器的运行时交互。硬件组件或内核可以用 C/C++ 开发,也可以使用 RTL 用于 PL 和 AI 引擎。

主要特性

Performance icon

功耗与性能

  • 与上一代 AMD UltraScale+™ 相比,性能提升高达 10 倍,并降低了各种应用的功耗
  • 业界领先的计算性能:高达 145 TOPS (int8);37 TOPS (int16);12T FLOPs (fp32)
Performance icon

熟悉的开发环境

reconfigurable-icon

混合内核开发

  • 使用混合内核自定义您自己的数据管道
  • 使用 C/C++ 开发 AIE 内核,使用 RTL 或 HLS 开发 PL 内核,并使用 Vitis 连接整个系统

启动 AI 引擎开发


第 1 步: 购买

购买配备 VCK5000 量产芯片的卡。

购买 > 

第 2 步访问安全站点

请求访问 VCK5000 Versal 开发卡安全站点

第 3 步: 开始设计

按照 VCK5000 Versal 开发卡安全站点的入门/安装指南。

AI 引擎开发技术文章


cuda-vitis
文章

VCK5000 上的 Vitis AIE API

本文将向您展示如何使用 Vitis 2021.2 的 AIE API(高度抽象的 AI 引擎 API)开发 AI 引擎内核,从而显著提升您的设计生产力。 此 AIE API 是更高层次抽象 C++ API,以 C++ 标头库实现,仅提供转换为高效低层次 AI 引擎的数据类型和操作。 AI 引擎 API 是一种支持 AI 引擎内核编程的方法,提升不同 AI 引擎架构之间的可移植性。

exploring-support-vector-machine-acceleration-with-vitis
文章

从 Cuda 迁移至 Vitis

本文适用于熟悉 CUDA 和 Nvidia GPU 的开发者。 此文可为您提供解决方案!通过 CUDA 架构了解如何使用 AMD Vitis 开发并行硬件。

kernel-code
文章

使用 Vitis 为 Versal 自适应 SoC 优化内核代码

Vitis 是一个统一软件平台,用于在 FPGA (Field Programmable Gate Array)、SoC (System on Chip)、 和 Versal 自适应 SoC 等异构平台上开发嵌入式软件和加速应用。 本文简要介绍了 Vitis,然后讨论了关键内核优化以充分利用芯片。

image-1-vitis-code
文章

为什么选择 AMD 解决方案来加速您在各行业的应用?

Vitis 提供了许多开发套件和库来加速许多行业的应用,使其比传统的 FPGA 流程更容易。 对于熟悉使用 C/C++ 或 Python 开发基于 CPU/GPU 的软件开发者来说,它也是一个理想的设计环境。 Vitis 库涵盖了许多库,例如 CUDA,让您可以有效地迁移您的设计。

让我们深入探讨为什么 AMD 解决方案是加速应用的理想选择!

开发板规格

功耗与热量
卡规格 VCK5000
器件 VC1902
计算 有源 无源*
INT8 TOPs(峰值) 145 145
尺寸
高度 完整 完整
长度 完整 3/4
宽度 双插槽 双插槽
存储器
片外内存容量 16 GB 16 GB
片外总带宽 102.4 GB/s 102.4 GB/s
内部 SRAM 容量 23.9 MB 23.9 MB
内部 SRAM 总带宽 23.5 TB/s 23.5 TB/s
接口
PCI Express Gen3 x 16 / Gen4 x 8 Gen3 x 16 / Gen4 x 8
网络接口 2x QSFP28 (100GbE) 2x QSFP28 (100GbE)
逻辑资源
查找表 (LUT) 899,840 899,840
最大总功率 225W 225W
散热 活跃 无源

* 我们只提供有源开发板。如果您从 VCK5000 移除风扇,请按照 硬件安装指南,将其变为无源。

技术文档

Default Default 标题 文件类型 日期