可编程逻辑可为差异性、持续性、不断变化的算法开发自定义计算模块。这些灵活应变的引擎加载了各种广泛的内存元件,并与可编程 I/O 紧密耦合,允许用户为任何应用创建强大的加速器。
标量引擎可支持不同的应用需求。应用处理单元非常适合操作系统支持的复杂应用,实时处理单元非常适合时延敏感型应用。一款单独的平台管理控制器管理系统启动、安全性与调试。
Versal Premium 系列 112G PAM4 收发器是实现功率优化型 800G 网络系统的核心。Versal Premium 自适应 SoC 在同一器件上提供 32G、58G 和 112G 收发器的广泛选择,允许厂商扩展主流 100G 系统、增加 400G 部署,并将自己定位为 800G 以上的厂商。
Versal Premium 自适应 SoC 提供 1.6Tb/s 的行速率加密吞吐量,因此是安全网络的理想平台。它在灵活应变的平台上采用业界唯一的硬化 400G 通道高速加密 (HSC) 引擎。HSC 引擎支持 AES-GCM 加密/解密、MACsec 和 IPsec,可实现多层安全性。
专用连接 IP 支持多种数据速率和协议,可实现几太比特的安全以太网。100G 和 600G 以太网内核的混合,不仅可提供高达 5Tb/s 的吞吐量,而且还可从接入网络扩展到地铁,再到核心网络,所有这些都在单个平台上完成。
器件中集成的 Interlaken 内核可通过内建的流量控制支持高达 600Gb/s 的速率,实现高带宽的可靠数据传输。凭借可实现功率优化纠错的集成型 RS-FEC,Versal Premium 器件不仅支持可扩展的芯片至芯片互连,同时还可最大限度减少网络系统的 I/O 和电源开销。
PCIe® Gen5 可为新一代计算应用加速服务器 CPU 至加速器的通信,而支持可编程 NoC 的 DMA 引擎则可实现工作负载配置与部署的可扩展全方位虚拟化。CCIX 子块为不同的云拓扑启用(a)对称通信。
可编程片上网络 (NoC) 在出现在 Versal 自适应 SoC 架构中的不同计算引擎和集成型 IP 块之间提供数 TB 的优化互连,不仅可简化时序收敛,而且还可节省逻辑资源。NoC 编译器不仅提供优化的编程体验,同时还允许用户为关键数据路径管理时延和 QoS。
相控雷达阵列的自适应波束形成可在频谱竞争环境下执行精确跟踪和制导。支持 AI 引擎的 Versal™ Premium 器件可实现比上一代产品高 4 倍的信号处理功能 1,因此设计人员可实现除波束形成外的更多计算密集型功能。AI 引擎和 DSP 引擎原生支持各种数据类型,包括用于更大动态范围的高效单精度浮点,这在雷达应用中至关重要。
Versal Premium 系列提供 112G PAM4 收发器,支持功耗优化型 IP,从而可在缓解系统集成、降低时延和功耗的同时,确保从天线到后端接口的安全组网。Versal 架构的创新异构集成为大量的雷达系统设计带来了业界领先的尺寸、重量和功耗 (SWaP) 降低优势。
1:总体等效 DSP 引擎容量与 Virtex™ UltraScale+™ VU13P FPGA 的比较
由于 5G 无线、xHaul、PON 和线缆接入的带宽需求快速增长,地铁/交通网络面临着巨大的压力,需要对网络流量进行聚合和智能处理。Versal™ Premium 系列提供 112G 的 PAM4 收发器,其支持专用连接 IP,如 600G 通道化多速率以太网和支持 FEC 的集成型 600G Interlaken 等,可在复杂的地铁/核心交通网络中实现高效的散热设计。
Versal Premium 的计算密度是传统硬件可编程器件的两倍,可实现硬件差异化、适应不断发展的标准,并为未来自主智能网络融入 AI/ML。
作为一个异构平台,Versal Premium 拥有世界上最高的计算密度,可针对基因组学、视频转码、搜索和机器学习等各种工作负载实现灵活应变的云加速。
Dynamic function eXchange (DFX) 允许用户以毫秒为单位交换计算内核,以配置加速器,最高效地使用云基础架构。Versal Premium 具有海量片上内存容量和带宽,以及比当前部署的 FPGA 加速器高一倍的计算密度,可提供优异的计算能力和优化的协调。
Versal Premium 从零开始构建,能够与云基础架构无缝集成,它提供了一个集成的 shell,其可确保在启动时提供主机服务器与系统内存的通信,因此加速器设计人员可减少连接所需的时间,增加实现差异化的时间。
随着数据中心规模的扩大,数据中心互连 (DCI) 技术必须不断发展,才能实现高容量、高可扩展性以及高功率效率。Versal Premium 系列提供高达 112G 的可扩展收发器、高达 5Tb/s 的以太网吞吐量和 1.6Tb/s 的行速率加密,允许服务提供商部署灵活的传输技术,从而可在数据中心之间实现快速、安全的连接。
为了开拓从数据中心到 5G 的网络技术,供应商需要利用尖端通信测试设备来确保互操作性和稳健的网络流量管理。Versal Premium 系列的 AI 引擎和 DSP 引擎提供业界领先的信号处理性能和逻辑功能,可为自动化测试、数据流控制、跟踪和报告实现最复杂的测试逻辑。
112G 的 PAM4 收发器具备支持新兴协议的集成型 KP4 FEC,以及光学器件和背板的互操作性。专用的通道化多速率以太网内核总吞吐量为 5Tb/s,可单独访问 MAC、PCS 和 FEC 模块,以及用于自定义错误注入和统计分析的可编程逻辑资源。
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | |||||||||||
实时处理单元 | 双核 Arm® Cortex R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM | |||||||||||
存储器 | 支持 ECC 的 256KB 片上内存 | |||||||||||
连接功能 | 以太网 (x2)、UART (x2)、CAN FD (x2)、USB 2.0 (x1)、SPI (x2)、I2C (x2) |
VP1002 | VP1052 |
VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
AI 引擎 | - | - | - | - | - | - | 472 |
- | - | - | 472 | - |
DSP 引擎 | 1,140 | 1,572 | 1,904 | 3,984 | 2,672 | 7,440 | 7,392 | 7,392 | 10,896 | 14,352 | 14,304 | 6,864 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
系统逻辑单元 (K) | 833 | 1,186 | 1,575 | 1,969 | 2,233 | 3,763 | 3,738 | 3,837 | 5,558 | 7,352 | 7,326 | 18,507 |
LUT 数 | 380,800 | 542,080 | 719,872 | 900,224 | 1,020,928 | 1,720,448 | 1,708,672 | 1,753,448 | 2,540,672 | 3,360,896 | 3,349,120 | 8,460,288 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
GTY 收发器 (32.75 Gbps) | 20 | 20 | - | - | - | - | - | - | - | - | - | |
GTYP 收发器1 (32.75 Gbps) | - | - | 8 | 281 | 8 | 281 | 281 | 681 | 281 | 281 | 281 | 128 |
GTM 收发器 (56G (112G)) | 24 (12) | 48 (24) | 64 (32) | 20 (10) | 96 (64) | 60 (30) | 60 (30) | 20 (10) | 100 (50) | 140 (70) | 140 (70) | 32 (16) |
CCIX & PCIe® w/DMA (CPM4) | 2 x Gen4x4 | 2 x Gen4x4 | - | - | - | - | - |
- | - | - | - | - |
CCIX & PCIe w/DMA (CPM5) | - |
- |
- | 2 x Gen5x8 | - |
2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | - |
PCI Express® | 1 x Gen4x8 | 1 x Gen4x8 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 8 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 16 x Gen5x4 |
100G Multirate Ethernet MAC | 3 | 5 | 6 | 2 | 6 |
4 | 4 | 4 | 6 | 8 | 8 | 12 |
600G Ethernet MAC | 2 | 3 | 7 | 1 | 11 | 3 | 3 | 1 | 5 | 7 | 7 | 4 |
600G Interlaken | 1 | 2 | 0 | 0 | 0 | 1 | 1 | 0 | 2 | 3 | 3 | 0 |
400G 高速加密引擎 | 1 | 1 | 3 | 1 | 4 | 2 | 2 | 2 | 3 | 4 | 4 | 0 |
1. 16 GTYP 收发器专门用于 CPM5,主要针对 PCI Express 的使用情况
Versal™ 自适应 SoC 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 AMD Vivado™ ML 版引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado ML 版 >
AMD Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。作为开源社区的重要成员,Vitis 统一软件平台是完全免费和开源的。
下载 Vitis™ 统一软件平台 >
AMD Vitis Model Composer 是一款基于模型的设计工具,可在 Simulink® 和 MATLAB® 环境中快速进行设计探索。它可促进 AI 引擎 ADF 图形开发和系统级测试,允许用户将 RTL 和 HLS 块与 AI 引擎内核和/或图形整合在相同的仿真中。如需了解如何将 Versal AI 引擎与 Vitis Model Composer 结合使用,请访问 AI 引擎资源页面。
Versal Premium 器件基于与 Versal Prime 系列和 Versal AI 内核系列相同的架构。评估套件拥有启动设计所需的一切,包括执行系统测试、评估关键接口以及采用 自适应 SoC 设计方法的功能。
立即购买 Versal Premium 系列 VPK120 评估套件 >
购买 Versal AI 内核系列 VCK190 评估套件,满足 AI 引擎应用需求 >
购买 Versal Prime 系列 VMK180 评估套件,满足其它通用架构模块应用需求 >
AMD 培训和学习资源提供了实用的实践技能和基础知识,可助力开发者在下一个开发项目中充分发挥生产力。
使用 Versal ACAP 进行设计:架构和方法
使用 Versal ACAP 进行设计:片上网络
使用 Versal ACAP 进行设计 - 电源和开发板设计
使用 Versal AI 引擎进行设计 1 :架构与设计流程
使用 Versal AI 引擎进行设计 2:使用 AI 引擎内核进行图形编程
使用 Versal AI 引擎进行设计 3 – 内核编程和优化