AMD VCK5000 Versal™ 开发卡采用 AMD 7nm Versal 自适应 SoC 架构,用于优化 5G、数据中心计算、AI、信号处理、雷达等应用。VCK5000 特定域架构得到了 Vitis™、Vitis AI,以及 Mipsology Zebra® 和 Aupera® VMSS 等合作伙伴解决方案的全面支持,不仅带来了强大的单位功耗性能(马力),同时还在 C/C++ 软件可编程性中保持了易用性。
与 nVidia 旗舰 GPU 相比,VCK5000 开发平台在标准 AI 基准测试中提供接近 100% 的每瓦计算效率和 2 倍的 TCO,因此是为云端应用和边缘应用实现 CNN、RNN 和 NLP 加速的理想开发平台。
如果您是一名 AI 开发人员,请使用 Mipsology Zebra 将 TensorFlow 和 PyTorch 训练模型直接带到 Versal 上推断并使用 Aupera 视频机器学习流媒体服务器解决方案在 FPGA 平台上构建、配置和部署计算机视觉应用。
查看合作伙伴解决方案,阅读技术文章并获得重要特性,以便使用 VCK5000 执行 AI 推断开发
ML 任务繁重:H.264 解码 + Yolov3 + 3x ResNet-18
视频任务繁重:H.264 解码 + tinyYolov3 + 3x ResNet-50
Zebra 将高性能与前所未有的易用性结合在一起,是 AMD 的首选 AI 加速器,可用于为基于图像的 AI 应用计算神经网络。
Zebra 可无缝替换 GPU/CPU,以更快的速度和更低的功耗计算任何基于图像的神经网络。使用 Zebra,无需重新训练您的网络或应用,也无需对其做出任何修改。Zebra 使用简单的 Linnux 命令执行部署,因此使用 Zebra,无需掌握 FPGA 知识。
Aupera VMSS 是一个面向视频 AI 推断应用的软件框架。使用 VMSS2.0,用户无需编码,便可使用图形用户界面 (GUI) 快速构建、配置和部署计算机视觉流水线。使用 Aupera 的节点工具套件并执行解码、预处理和后处理等任务,可轻松构建自定义流水线,也可通过创建自定义节点构建该流水线,这些自定义节点可通过 GUI 上传、构建、测试和使用。
Aupera 的商用视频 AI 应用也可通过该框架配置、启动和查看。用户可选择通过视频叠加或发送文本输出来检查自定义流水线的结果。
数据中心越来越多地采用人工智能来管理从设备监控到服务器优化的各种任务。基于 FPGA 的自适应计算在数据中心中起着核心作用,通常被证明是运行复杂 AI 工作负载的最高效、最具成本效益的解决方案。
2021 自适应计算挑战赛展示了将 VCK5000 开发卡与 Vitis AI 结合使用的最佳方式。
如果您想使用 AI 引擎和可编程逻辑实现算法加速,我们提供 AI引擎 C/C++ 高层次抽象 API 和 Vitis 加速库。Vitis 端到端流程使用 C/C++ 开发,在 X86 或嵌入式处理器上运行,并通过 XRT 管理与加速器的运行时交互。硬件组件或内核可以用 C/C++ 开发,也可以使用 RTL 用于 PL 和 AI 引擎。
购买配备 VCK5000 量产芯片的卡。
请求访问 VCK5000 Versal 开发卡安全站点。
按照 VCK5000 Versal 开发卡安全站点的入门/安装指南。
卡规格 | VCK5000 | |
---|---|---|
器件 | VC1902 | |
计算 | 有源 | 无源* |
INT8 TOPs(峰值) | 145 | 145 |
尺寸 | ||
高度 | 完整 | 完整 |
长度 | 完整 | 3/4 |
宽度 | 双插槽 | 双插槽 |
存储器 | ||
片外内存容量 | 16 GB | 16 GB |
片外总带宽 | 102.4 GB/s | 102.4 GB/s |
内部 SRAM 容量 | 23.9 MB | 23.9 MB |
内部 SRAM 总带宽 | 23.5 TB/s | 23.5 TB/s |
接口 | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
网络接口 | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
逻辑资源 | ||
查找表 (LUT) | 899,840 | 899,840 |
最大总功率 | 225W | 225W |
散热 | 活跃 | 无源 |
* 我们只提供有源开发板。如果您从 VCK5000 移除风扇,请按照 硬件安装指南,将其变为无源。