产品优势
Versal HBM 系列实现了高速存储器、安全连接和自适应计算的异构集成,可消除内存受限、计算密集型工作负载(如机器学习、数据库加速、新一代防火墙和高级网络测试器)的处理与内存瓶颈。它从头开始构建,可适应不断发展的算法、协议和数据速率。 观看简介视频 ,了解更多详情。
集成 HBM2e DRAM,因此与 Versal Premium 系列相比,Versal HBM 系列可提供高达 6 倍的带宽,每比特功耗锐降 65%*。Versal HBM 系列在经量产验证的 Versal Premium 自适应 SoC 系列的基础上构建,集成了各种多太比特 (multi-terabit) 网络连接、功耗优化型连接核心、112 Gb/s PAM4 收发器,以灵活适应新兴的网络协议和模块。Versal HBM 系列在将收发器速度提高一倍的同时,可使用内置加密引擎为网络基础设施的每一层提供安全保护。有了可编程片上网络 (NoC),高达 2.2 Tb/s 的片上连接可缓解架构组件之间的路由拥塞。此外,Versal HBM 系列还可提供比上一代 HBM 解决方案高 1 倍的逻辑密度,从而可为不断发展的算法和协议充分提高性能。
*根据 AMD 2023 年 5 月的内部分析,将单个支持封装内 HBM2E 的 Versal HBM VH1542 器件与 4 个 LPDDR4-4266 组件的 Versal Premium VP1502 器件实施方案进行了比较。假设顺序内存访问有 40% 的读取/写入事务处理。使用 AMD Power Design Manager 和第三方系统功耗计算器生成的功耗计算结果。结果会因配置而有所不同。 (VER-013)

主要特点
- 集成的 HBM2e
- 可扩展的串行带宽
- 功耗优化、网络化 IP
- 可编程逻辑
- DSP 引擎
- 处理系统

集成的 HBM2e
该系列集成了 HBM2e 技术,可提供 819 GB/s 存储器带宽和 32 GB 容量,为计算密集型应用降低功耗、延迟和尺寸。与商用内存解决方案 (DDR5) 相比,Versal HBM 自适应 SoC 通过将堆叠内存直接放置在计算互连结构附近,提供比 Versal Premium 系列 1 高达 6 倍的带宽,每比特功耗锐降 65%。集成的 HBM 可通过可编程 NoC 从器件的任何位置进行全局访问。通过集成的内存控制器和增强的硬化交换机功能,可从任何端口访问任何内存位置。
1.根据 AMD 2023 年 5 月的内部分析,将单个支持封装内 HBM2E 的 Versal HBM VH1542 器件与 4 个 LPDDR4-4266 组件的 Versal Premium VP1502 器件实施方案进行了比较。假设顺序内存访问有 40% 的读取/写入事务处理。使用 AMD Power Design Manager 和第三方系统功耗计算器生成的功耗计算结果。结果会因配置而有所不同。(VER-013)
Versal HBM 系列产品简介
Versal HBM 系列在单个平台上融合了高速存储器、灵活应变的计算和安全连接。

应用和行业

机器学习加速
人工智能和机器学习 (AI/ML) 技术发展迅速;复杂的算法需要能够处理海量数据的性能以及巨大的内存带宽。在传统计算架构中,当多个 CPU 内核同时工作时,由于外部内存中数据移动的速度不够快,并且最终会达到速度瓶颈,因此系统会停止运行。相比之下,Versal HBM 系列通过灵活应变的引擎和智能引擎提供海量并行处理能力,并通过集成型 HBM 提供极高的存储器带宽。因此,Versal HBM 系列能够为许多 AI/ML 流程(如余弦相似度和 Louvain 模块化)实现更快的精确数据洞察。通过 Vitis™ 统一软件平台的各种性能优化的库,基于 Versal HBM 自适应 SoC 的解决方案可以为快速发展的数据中心及云计算人工智能提供更高的 AI/ML 性能与能效。
计算预处理与缓冲
预处理数据对于从功能固定的计算器件获得最佳结果至关重要。现实 ML 模型的数据集大小很容易超过太字节。因此,目标加速器需要大型数据预处理框架来高效处理这些数据集。使用灵活应变的引擎和 819 GB/s 的 HBM 带宽,Versal HBM 系列可删除不需要的数据,转换选定的数据,并增强数据,从而可为目标加速器创建强大的预测输入。Versal HBM 系列配备高速 112G PAM4 收发器,能够以低延迟大幅提高吞吐量和系统性能。


新一代防火墙
网络运营商希望实现不间断的智能管理并提供稳健的网络,以保护数据并避免企业网络遭受攻击。
Versal HBM 系列可实现卓越的可扩展性,有助于实现从物理层和数据链路层到 VPN,再到传输层安全级别的多层网络安全性,从而可通过定制策略及控制实现数以千万计的同时会话。此外,多个 400G 集成型高速加密 (HSC) 引擎允许系统在不影响性能的情况下,保持线速率吞吐量和低延迟。使用 32G HBM,新一代防火墙可以管理多个查找表,无需访问外部内存来缓冲网络流量并对其进行重新排序。112G PAM4 收发器可实现对最新可扩展光学标准和协议的支持,带来新一代防火墙所需的更高吞吐量。灵活应变的引擎有助于 ML 算法针对新兴威胁为安全架构实现现代化。
应用性能测试设备
随着数据中心、云计算和人工智能网络开始为 800G 光网连接做准备,许多数据中心网络和云计算服务提供商需要利用先进测试设备,才能确保为计算密集型应用带来互操作性和稳健的网络基础设施。
Versal HBM 器件中的 112G PAM4 收发器是最重要的构建块之一,可帮助数据中心网络及云计算服务提供商构建能够适应新兴协议和光学互操作性的网络。专用信道化多速率以太网内核提供可单独访问的 HSC、MAC、PCS 和 FEC 模块以及 32G HBM 和可编程 NoC,可为 L4-L7 测试设备的海量流量缓冲、高效数据移动、智能数据流控制、跟踪与报告实现复杂的测试逻辑。

产品规格
内存特性
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
HBM DRAM (GB) | 8 | 16 | 32 | 16 | 32 |
Block RAM (Mb) 总数 | 89 | 89 | 89 | 132 | 132 |
UltraRAM (Mb) | 366 | 366 | 366 | 541 | 541 |
总 PL 内存 (Mb) | 509 | 509 | 509 | 752 | 752 |
DSP 引擎特性
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
DSP 引擎 | 7392 | 7392 | 7392 | 10848 | 10848 |
可编程逻辑特性
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
系统逻辑单元 (K) | 3837 | 3837 | 3837 | 5631 | 5631 |
LUT | 1753984 | 1753984 | 1753984 | 2574208 | 2574208 |
处理子系统特性
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex®-A72、48 KB/32 KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | ||||
实时处理单元 | 双核 Arm Cortex-R5F、32 KB/32 KB L1 高速缓存以及支持 ECC 的 256 KB TCM | ||||
内存 | 支持 ECC 的 256 KB 片上内存 | ||||
连接 | 以太网 (x2)、UART (x2)、CAN-FD (x2)、USB 2.0 (x1)、SPI (x2)、I2C (x2) |
平台特性
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
GTYP 收发器 (32.75 Gb/s) | 681 | 681 | 681 | 681 | 681 |
GTM 收发器 (56G (112G)) | 20 (10) | 20 (10) | 20 (10) | 60 (30) | 60 (30) |
支持 DMA (CPM5) 的 PCIe® | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 |
PCI Express (PLPCIE5) | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 |
400G 高速加密引擎 | 2 | 2 | 2 | 3 | 3 |
100G 多速率以太网 MAC | 4 | 4 | 4 | 6 | 6 |
600G 以太网 MAC | 1 | 1 | 1 | 3 | 3 |
600G Interlaken | 0 | 0 | 0 | 1 | 1 |
1.16 GTYP 收发器专门用于 CPM5,主要针对 PCI Express 的使用情况。
面向所有开发者
AMD 提供优秀的软件开发环境以供开发者利用自适应 SoC 和 FPGA 开展设计工作,其中包括各种工具(编译器、仿真器等)、IP 和解决方案。
该环境不但可以帮助开发者缩短开发时间,还可以助力实现更出色的性能功耗比。 这些工具可帮助 AI 科学家、应用与算法工程师、嵌入式软件以及传统硬件等各类开发者使用 AMD 自适应计算解决方案。

立即体验
利用该套件提供的经过验证的硬件、软件支持、工具、设计示例和文档,快速启动您的设计周期,并实现快速上市。

通过 Versal HBM 系列 VHK158 评估套件启动开发
立即通过支持 VH1582 器件的 VHK158 评估套件启动 Versal HBM 系列的功能评估。该平台利用集成 HBM,非常适合开发计算密集型、内存密集型应用。利用该套件提供的经过验证的硬件、软件支持、工具、设计示例和文档,快速启动您的设计周期,并实现快速上市。
资源

随时掌握最新动态
加入 Versal 通知列表,即可第一时间获取最新信息。