UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

可重配置加速

开发并部署云级平台

云数据中心正在发生变化。 今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供应商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

微软和百度等大型云端服务供应商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可编程性,而且还能针对任何新应用或新算法进行硬件优化。 

随着时间的推移,FPGA 可重配置及可再编程的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,Xilinx FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 CPU 和定制 ASIC 无法实现的。 

Xilinx 在数据中心领域的发展势头

客户 — 七大超大规模云服务公司有 3 家部署了 Xilinx FPGA,其中包括百度,百度已于 10 月宣布在数据池中设计了 Xilinx UltraScale™ FPGA,以加速机器学习推理。 

合作伙伴高通IBM 宣布与 Xilinx 开展数据中心加速战略合作。 与 IBM 的合作已形成存储及网络加速框架 CAPI SNAP,其可帮助开发人员更便捷地使用 Xilinx FPGA 加速 NoSQL 等应用。

标准领导地位 — Xilinx 一直引领着智能高速缓存一致性互联(CCIX) 开发的产业计划。  Xilinx 于 2016 年 3 月与 AMD、ARM、华为、IBM、Mellanox 和高通联合成立了 CCIX,5 个月来该计划的成员数量已是成立之初的 3 倍。 

面向数据中心的软件定义工具与产品 —  面向 FPGA 加速的 SDAccel™ 开发环境于 2014 年发布。2016 年 11 月, Xilinx 披露采用高带宽存储器和 CCIX 技术的新型 16nm Virtex UltraScale+ FPGA 细节。

最新 Xilinx 可重配置加速协议栈不仅可帮助全球最大的云服务供应商开发和部署云级加速平台,而且还可为机器学习、数据分析和视频转码等复杂云计算应用提供无与伦比的高灵活性。这款基于 FPGA 的加速协议栈针对云原生应用设计,包含库、框架集成、开发板与资源以及 OpenStack 支持,所提供的计算效率比 CPU 高 40 倍、比当前市场任何其它 FPGA 高 6 倍。

下载来自 MOOR Insights and Strategy 的分析简报 (中文)

查看 Xilinx 技术论文 中的白皮书 “利用 Xilinx 器件的 INT8 优化开展深度学习” (中文)。

立即采用 基于云的测试驱动器启动设计。

查看该协议栈如何加速机器学习

成为第一批收到加速新闻及 Xilinx 更新信息通知 的人。

acceleration-libraries

协议栈中的库

DNN —— Xilinx 的深度神经网络 (DNN) 库是构建深度学习推理应用的高度优化库。 经过精心设计,能够以 16 位及 8 位的整数数据类型实现最高的计算效率。

GEMM — Xilinx 的通用矩阵乘法 (GEMM) 库基于 3 级基本线性代数子程序 (BLAS),不仅可实现 16 位和 8 位整数数据类型的优化性能,而且还支持任何规模的任何矩阵。

HEVC 解码器和编码器 — HEVC/H.265 是 MPEG 和 ITU 标准机构推出的最新视频压缩标准。它是 H.264 的后续标准,可带来多达 50% 的带宽降低。Xilinx 提供两款编码器 — 支持大多数视频数据中心工作负载的高质量、高灵活实时编码器,以及非摄像机生成内容的替代解决方案。解码器支持针对这两款编码器的所有应用。

数据移动器 (SQL) — SQL 数据移动器库便于使用 Xilinx FPGA 加速数据分析工作负载。数据移动器库可通过 PCIe 从数据库列表将数据块发送至 FPGA 加速卡的片上存储器,从而可协调针对 SQL 数据库的标准连接。该库经过优化,能通过 FPGA 器件最大限度地利用主机 CPU 和加速器功能之间的 PCIe 带宽

计算内核 (SQL) — 在 FPGA 硬件上加速大量内核 SQL 函数(例如小数类型、数据类型、扫描、比较、过滤等)的库。计算功能经过优化,可利用 FPGA 大规模硬件并行的优势。

开发板 类型
供应商
Xilinx® Kintex® UltraScale™ FPGA 加速开发套件 开发人员评估 Xilinx
Bittware PCIe 板
生产
Bittware
Alpha Data ADM-PCIE-KU3 生产 Alpha Data
Alpha Data ADM-PCIE-7V3 生产 Alpha Data
COTS PEA-C8K0-060
生产
COTS
COTS PEA-C8K0-040 生产 COTS
Semptian NSA-120 加速卡 生产 Semptian
存储加速卡 (NVMeoF) 生产 Fidus

SDAccel™ 是 OpenCL™ 应用的开发环境,主要面向 Xilinx® FPGA 加速卡。该环境支持系统内处理器和 FPGA 结构的同步编程,无需 RTL 设计经验。应用可按照采用 C/C++ 语言编写的主机程序进行采集,一系列计算内核使用 C、C++ 或 OpenCL C 语言表达。

Xilinx 与大数据及机器学习的异构加速器云端解决方案领先供应商 Nimbix 公司合作,共同创建可通过 C/ C++ 和 OpenCL 利用 FPGA 计算密度的新一代应用。

Nimbix 的产品能大幅减少充分利用高性能、高功效 FPGA 所遇到的障碍,从而可加速各行各业的高端计算工作流程。 开发人员现在可在云端运行这些工具,然后在最新 Xilinx 加速硬件上进行测试和部署,既不需要前期投资,也不需要购买设备。

如欲启动云端应用加速平台设计,敬请访问:http://www.nimbix.net/xilinx

Nimbix Cloud 上的 Xilinx 应用加速 

面向 OpenCL™、 C 和 C++ 的 SDAccel™ 开发环境利用 FPGA 将数据中心单位功耗性能提升高达 25 倍。作为 SDx™ 系列的成员,SDAccel 是首个面向 OpenCL、 C 和 C++进行架构优化的编译器,并结合了#库、开发板,可在FPGA上实现类似 CPU/GPU 的开发运行体验 。了解更多信息,敬请访问 SDAccel 专区

sdaccel-cpu

技术文档

资源

加速资源  说明
在电源系统上使用 FPGA 加速的低功耗机器学习 本次讨论会将概要介绍 FPGA 加速如何为图像识别等机器学习工作负载改善电源系统。
在深度流水线 FPGA 群集上实现高能效 CNN 本白皮书将介绍深度流水线多 FPGA 架构,其可扩展设计空间,实现最佳性能及能源效率。
从模型到 FPGA 的软硬件协同设计实现高效神经网络加速 本次讲演主要讨论  FPGA 的使用以及神经网络加速的趋势。
百度采用 FPGA 方案显著加速 SQL 本文讨论百度采用 FPGA 应对大数据挑战的方案。
SDA:通用大数据分析系统的软件定义加速器 本次讲演讨论百度通用大数据分析系统的软件定义加速器。
SDA:大型 DNN 系统的软件定义加速器 本文包括作者所做会议报告的一系列幻灯片,这些报告涉及具体特性、系统设计与架构、处理功能以及百度一系列软件定义加速器产品 (SDA) 的目标市场,主要面向大型深度神经网络 (DNN) 系统。
用户论坛
讨论与 OpenCL™、C、C++ SDAccel™ 开发环境有关的主题的社区