UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

可重配置加速

开发并部署云级平台

云数据中心正在发生变化。 今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供应商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

亚马逊、微软和百度等大型云端服务供应商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可编程性,而且还能针对任何新应用或新算法进行硬件优化。 

随着时间的推移,FPGA 可重配置及可再编程的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,Xilinx FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 CPU 和定制 ASIC 无法实现的。 

Xilinx 在数据中心领域的发展势头

客户 — 七大超大规模云服务公司有 3 家部署了 Xilinx FPGA,其中包括百度,百度已于 10 月宣布在数据池中设计了 Xilinx UltraScale™ FPGA,以加速机器学习推理。 

合作伙伴高通IBM 宣布与 Xilinx 开展数据中心加速战略合作。 与 IBM 的合作已形成存储及网络加速框架 CAPI SNAP,其可帮助开发人员更便捷地使用 Xilinx FPGA 加速 NoSQL 等应用。

标准领导地位 — Xilinx 一直引领着智能高速缓存一致性互联(CCIX) 开发的产业计划。  Xilinx 于 2016 年 3 月与 AMD、ARM、华为、IBM、Mellanox 和高通联合成立了 CCIX,5 个月来该计划的成员数量已是成立之初的 3 倍。 

面向数据中心的软件定义工具与产品 —  面向 FPGA 加速的 SDAccel™ 开发环境于 2014 年发布。2016 年 11 月, Xilinx 披露采用高带宽存储器和 CCIX 技术的新型 16nm Virtex UltraScale+ FPGA 细节。

最新 Xilinx 可重配置加速协议栈不仅可帮助全球最大的云服务供应商开发和部署云级加速平台,而且还可为机器学习、数据分析和视频转码等复杂云计算应用提供无与伦比的高灵活性。这款基于 FPGA 的加速协议栈针对云原生应用设计,包含库、框架集成、开发板与资源以及 OpenStack 支持,所提供的计算效率比 CPU 高 40 倍、比当前市场任何其它 FPGA 高 6 倍。

从 Xilinx 研发团队获得有关在超大规模数据中心实现 FPGA 加速的最新信息

查看 Xilinx 技术论文 中的白皮书 “利用 Xilinx 器件的 INT8 优化开展深度学习” (中文)。

了解有关在亚马逊云端实现 FPGA 加速的信息。

立即开启 基于云的测试

欢迎注册,以便在 Xilinx 提供加速新闻及更新信息时获得通知

acceleration-libraries

协议栈中的库

DNN —— Xilinx 的深度神经网络 (DNN) 库是构建深度学习推理应用的高度优化库。 经过精心设计,能够以 16 位及 8 位的整数数据类型实现最高的计算效率。

GEMM — Xilinx 的通用矩阵乘法 (GEMM) 库基于 3 级基本线性代数子程序 (BLAS),不仅可实现 16 位和 8 位整数数据类型的优化性能,而且还支持任何规模的任何矩阵。

HEVC 解码器和编码器 — HEVC/H.265 是 MPEG 和 ITU 标准机构推出的最新视频压缩标准。它是 H.264 的后续标准,可带来多达 50% 的带宽降低。Xilinx 提供两款编码器 — 支持大多数视频数据中心工作负载的高质量、高灵活实时编码器,以及非摄像机生成内容的替代解决方案。解码器支持针对这两款编码器的所有应用。

数据移动器 (SQL) — SQL 数据移动器库便于使用 Xilinx FPGA 加速数据分析工作负载。数据移动器库可通过 PCIe 从数据库列表将数据块发送至 FPGA 加速卡的片上存储器,从而可协调针对 SQL 数据库的标准连接。该库经过优化,能通过 FPGA 器件最大限度地利用主机 CPU 和加速器功能之间的 PCIe 带宽

计算内核 (SQL) — 在 FPGA 硬件上加速大量内核 SQL 函数(例如小数类型、数据类型、扫描、比较、过滤等)的库。计算功能经过优化,可利用 FPGA 大规模硬件并行的优势。

开发板 类型
供应商
Virtex UltraScale+ FPGA VCU1525 加速开发套件 开发人员评估 Xilinx
Kintex UltraScale FPGA 加速开发套件 开发人员评估 Xilinx
Bittware PCIe 板
生产
Bittware
Alpha Data ADM-PCIE-KU3 生产 Alpha Data
Alpha Data ADM-PCIE-7V3 生产 Alpha Data
COTS PEA-C8K0-060
生产
COTS
COTS PEA-C8K0-040 生产 COTS
Semptian NSA-120 加速卡 生产 Semptian
存储加速卡 (NVMeoF) 生产 Fidus

可重配置的云加速

如今,计算需求呈指数级增长,CPU 技术无法跟上发展步伐,云计算及数据中心架构正朝着加速计算的方向发展。加速器不仅支持基于 CPU 的架构,同时还可实现高性能和高功率效率。

FPGA 不仅可在一系列广泛的应用中实现 10 倍的加速,而且还可重新配置,完美符合现代数据中心不断变化的工作负载要求。

Xilinx UltraScale™ 和 UltraScale+ FPGA 在加速性能方面比其它任何 FPGA 都领先整整一代,为硬件及应用开发人员助力于世界最大、最具创新性的云计算服务领域。

 

alibaba-logo

Alibaba Cloud F2 实例  
现已在中国市场推出

aws-logo
baidu-logo

百度 FPGA 云服务器
现已在中国市场提供测试版

huawei-logo

华为 FPGA 加速云服务器 (FACS)
现已在中国市场提供测试版

nimbix-logo

Nimbix FPGA 实例与开发环境
全球供应

tencent-cloud-logo

腾讯 FPGA 云服务器
现已在中国市场提供测试版

面向 OpenCL™、 C 和 C++ 的 SDAccel™ 开发环境利用 FPGA 将数据中心单位功耗性能提升高达 25 倍。作为 SDx™ 系列的成员,SDAccel 是首个面向 OpenCL、 C 和 C++进行架构优化的编译器,并结合了#库、开发板,可在FPGA上实现类似 CPU/GPU 的开发运行体验 。了解更多信息,敬请访问 SDAccel 专区

sdaccel-cpu

技术文档

资源

加速资源  说明
FPGA 初创公司为融合超大规模推断筹资 本文主要讨论基于 FPGA 的架构,该架构主要面向初创型公司 DeePhi Tech 提供的高效可扩展机器学习推断。
ESE:在 FPGA 上提供稀疏 LSTM 的高效语音识别引擎 FPGA2017 最佳论文奖得主以一款 FPGA 加速的高效语音识别引擎实现了突破性成果,该引擎与 CPU 相比,可实现 43x 的性能,40 倍的单位功耗性能;与 GPU 相比,可实现 3 倍的性能和 11 倍的单位功耗性能。
在电源系统上使用 FPGA 加速的低功耗机器学习 本次讨论会将概要介绍 FPGA 加速如何为图像识别等机器学习工作负载改善电源系统。
在深度流水线 FPGA 群集上实现高能效 CNN 本白皮书将介绍深度流水线多 FPGA 架构,其可扩展设计空间,实现最佳性能及能源效率。
从模型到 FPGA 的软硬件协同设计实现高效神经网络加速 本次讲演主要讨论  FPGA 的使用以及神经网络加速的趋势。
百度采用 FPGA 方案显著加速 SQL 本文讨论百度采用 FPGA 应对大数据挑战的方案。
SDA:通用大数据分析系统的软件定义加速器 本次讲演讨论百度通用大数据分析系统的软件定义加速器。
SDA:大型 DNN 系统的软件定义加速器 本文包括作者所做会议报告的一系列幻灯片,这些报告涉及具体特性、系统设计与架构、处理功能以及百度一系列软件定义加速器产品 (SDA) 的目标市场,主要面向大型深度神经网络 (DNN) 系统。
用户论坛
讨论与 OpenCL™、C、C++ SDAccel™ 开发环境有关的主题的社区
的页面