UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

的页面

SDx 开发环境

提供类似 GPU 和 CPU 的编程
体验,面向数据中心负载加速

面向 OpenCL™、 C 和 C++ 的 SDAccel™ 开发环境利用 FPGA 将数据中心单位功耗性能提升高达 25 倍。作为 SDx™ 系列的成员,SDAccel 是首个面向 OpenCL、 C 和 C++进行架构优化的编译器,并结合了#库、开发板,可在FPGA上实现类似 CPU/GPU 的开发运行体验 。

首个面向 OpenCL、C 和 C++进行架构优化的编译器

  • 结构优化的编译器,较之 CPU/GPU 可将数据中心单位功耗性能提升高达 25 倍。
  • 较之其他 FPGA 解决方案,实现了 3 倍性能和资源效能
  • 实现全新或已有的 OpenCL, C 和 C++ 代码,加速高性能加速器

首次可在 FPGA 上实现类似 CPU/GPU 的开发体验

  • 首款面向 FPGA 平台的完整的软件开发环境
  • 即便没有 FPGA 使用经验,也能优化 FPGA 平台的应用。
  • 轻松将应用移植到 FPGA 上,同时还可维护和重复用 OpenCL、C 和 C++ 代码。

首次可在 FPGA 上实现类似 CPU/GPU 的运行体验

  • 使用多程序和类似 CPU/GPU 的可加载计算单元,支持大型应用
  • 程序转移时维护系统功能,同时还能在执行应用时保持关键的系统接口和功能继续发挥作用。
  • 实现全新或已有的 OpenCL, C 和 C++ 代码,加速高性能加速器
sdaccel-cpu

SDAccel™ 是 OpenCL™ 应用的开发环境,主要面向 Xilinx® FPGA 加速卡。该环境支持系统内处理器和 FPGA 结构的同步编程,无需 RTL 设计经验。应用可按照采用 C/C++ 语言编写的主机程序进行采集,一系列计算内核使用 C、C++ 或 OpenCL C 语言表达。

Xilinx 与大数据及机器学习的异构加速器云端解决方案领先供应商 Nimbix 公司合作,共同创建可通过 C/ C++ 和 OpenCL 利用 FPGA 计算密度的新一代应用。

Nimbix 的产品能大幅减少充分利用高性能、高功效 FPGA 所遇到的障碍,从而可加速各行各业的高端计算工作流程。 开发人员现在可在云端运行这些工具,然后在最新 Xilinx 加速硬件上进行测试和部署,既不需要前期投资,也不需要购买设备。

如欲启动云端应用加速平台设计,敬请访问:http://www.nimbix.net/xilinx

Nimbix Cloud 上的 Xilinx 应用加速 

目录 实例 特性/描述 性能优势
入门 Hello “您好世界”示例是一项简单设计,可检测 FPGA 加速板是否安装正确。该示例采用内核编码的 printf 函数内部调用,报告主机向内核提供的值。  
Host_global_bandwidth 主机至全局存储器的宽带测试  
Kernel_global_bandwidth 全局至本地存储器的宽带测试  
Sum_scan 并行前缀和的示例  
Vadd 向量加法的简单示例。  
Vdotprod 向量点积的简单示例。  
Vmul_vadd 本示例展示全局存储器中存储的数据如何在不同二进制存储器中的内核之间共享。  
加速 bfgminer 在 SDAccel 平台上实现的比特币开采应用

80 Megahashes/秒

nearest_neighbor_linear_search 这是一个最近邻线性搜索算法的优化实现方案

256 Measurements/周期 

37.5Gigameasurements/秒

Smithwaterman 这是 smithwaterman 算法的优化实现方案。该应用的主要算法特征是 1。计算 MaxScore 2。脉动阵列实现方案  
安全 aes_decrypt AES-128 ECB 软件加密(随后输入采用 OpenCL 编写的译码)的实现方案,旨在通过 SDAccel 支持的 FPGA 加速卡执行。  
rsa 这是 RSA 解密算法的实现方案

1,024 位密文长度

272,340 字节/秒

sha1 这是一个 SHA1 安全散列算法的优化实现方案,该算法旨在通过 SDAccel 执行  
tiny_encryption 微型加密算法 (TEA) 实现方案示例,这是一个分组密码。  
视觉 Affine 仿射变换是一个线性映射方法,可保存点、线、面。

21.5fps

Convolve 卷积示例是一款高性能设计,可展示卷积图像滤波。该示例一次可处理 8 个像素的图像。

1,000fps

Edge_detection 边缘检测 Sobel 滤波器的实现方案。  
Histogram_codec 这是 12 位立方体均衡器的优化实现方案,该均衡器旨在通过 SDAccel 支持的 FPGA 加速卡执行。

333fps

Huffman_codec 这是哈夫曼编解码算法的实现方案,该算法旨在通过一款 SDAccel 支持的 FPGA 加速卡执行。  
Median_filer 这是用于消除图像噪声的中值滤波器的优化实现方案。

22,222fps

Watermarking 这是水印应用的优化实现方案,可为图像增加水印。

6,134fps

所提供的示例 ArrayFire — 极速园地 (Fast Corner) 演示 ArrayFire 开发的 FAST 特性检测  
Polito — K 最近邻算法 从 Rodinia 基准套件推导出的 k 最近邻算法。该项目旨在通过 SDAccel 在 Xilinx FPGA 上实现 k 最近邻算法。

1.23ms 的实时吞吐量

Polito — Black Sholes Monte Carlo 该项目使用欧洲及亚洲选项均可实现 Black-Scholes 财务模型的 Monte Carlo 仿真。它不仅包含一个可通过 SDAccel 映射至 FPGA 的 OpenCL C++ 内核,而且在性能相当的情况下,单位工作功耗比 GPU 实现方案低得多。

.315 ns

7.69 sims/焦耳

内置平台

电路板名称与说明 支持的器件 供应商
Xilinx® Kintex® UltraScale™ FPGA 加速开发套件
Kintex® UltraScale™ FPGA 加速开发套件是超大规模应用开发人员的极好起点。
Kintex UltraScale Xilinx
ADM-PCIE-KU3
ADM-PCIE-KU3 是一种高性能、可重配置、半长、小外形 x16 PCIe 电路板,基于 Xilinx Kintex UltraScale 系列平台 FPGA。
Kintex UltraScale Alpha Data
ADM-PCIE-7V3
ADM-PCIE-7V3 是一款高性能、可重构、半长、半高 x8 PCIe ® 外型电路板,基于 Xilinx® Virtex-7 系列平台 FPGA。
Virtex-7 Alpha Data

平台(外部提供)

电路板名称与说明 支持的器件 供应商
SB-850
SB-850 是一款全高度 GPU 长度 PCI Express 电路板,提供多达 8 个 HMC 器件和 1 个单路高性能 Xilinx UltraScale FPGA。
Kintex UltraScale Micron Pico Computing
M-505-K325T
商业卡尺寸的 M-505-K325T 是一款功能强大的计算设备,包含 FPGA 逻辑(带加载系统)、本地存储器子系统和全开关 PCIe x8 通信结构。
Kintex-7 Micron Pico Computing
COTS PEA-C8K0-060
PEA-C8K0-060 是基于 Xilinx Kintex Ultrascale FPGA 的高性能可重配置的半长半高单路 x8 PCI Express(PCIe) 3.0 板型开发板,是高要求应用的理想选择,其中包括高性能计算、数据处理、数据中心以及系统建模等。
Kintex COTS
COTS PEA-C8K0-040
PEA-C8K0-060 是基于 Xilinx Kintex Ultrascale FPGA 的高性能可重配置的半长半高单路 x8 PCI Express(PCIe) 3.0 板型开发板,是高要求应用的理想选择,其中包括高性能计算、数据处理、数据中心以及系统建模等。
Kintex COTS
Semptian NSA-120 加速卡
Semptian NSA-120 可提供一款基于 Xilinx FPGA 的全新异构计算平台,适用于大数据分析、云计算以及网络应用加速。它可用于大数据分析、图像识别/处理、视频编码/解码、数据压缩/解压缩、数据加密/解密、语音识别、神经网络、机器学习以及网络安全等应用。
Kintex Semptian

主要文档

SDAccel 快速入门视频教程

播放视频 应用主机的基本概念
OpenCL 的异构计算标准定义了在主机处理器和加速器件之间传输数据的编程模型。这段视频介绍了在器件(如FPGA)上进行数据传输和加速器控制所需的最小 OpenCL API 集合。
播放视频 N 维内核范围
OpenCL 中的一个关键概念就是将应用问题拆分成多维问题空间。被称为 N 维内核范围的每块问题空间可在器件中所提供的加速器上并行执行相同的计算。这段视频介绍了 N 维内核范围概念以及如何用它在并行计算系统上解决计算问题。
播放视频 OpenCL 应用结构
OpenCL 的异构计算标准为所有执行 OpenCL 标准的计算器件定义了基本编程模型。这段视频介绍了 OpenCL 应用的主机代码和内核元件。此外,还介绍了这些元件如何映射至包含 FPGA 加速器协处理卡的系统上。
播放视频 OpenCL 存储器架构
OpenCL 定义了一个存储器架构及抽象模型,其在所有执行该标准的计算器件中都很常见。这就意味着程序员只需了解一个存储器模型,这可简化应用编码工作。这段视频概括介绍了 OpenCL 存储器模型以及其如何在 FPGA 加速器件中实施。

设计服务

设计服务 Alliance 成员 市场
Cluster Technology Limited
Cluster Tech 不仅专门提供高级计算技术解决方案,而且还可利用高性能计算、云计算、商业智能以及金融工程来提高工作效率。
高性能计算、云计算、商业智能以及金融工程
Impulse Accelerated Technologies
Impulse Accelerated 可提供各种设计服务,其中工程师能够与设计团队协作,优化 FPGA 的设计。Impulse 擅长以一种可在真实环境中高效工作的方式及时完成复杂设计,从而能够与目标 FPGA 及电路板协作,确保经过良好测试、全面集成并完全归档的解决方案。
音视频与广播、汽车与交通运输、计算与数据处理、消费类、工业科学医疗
Irish Centre for High-End Computing (ICHEC)
ICHEC 提供各种服务帮助客户在高性能低功耗 Xilinx FPGA 上实现、优化和部署基于 OpenCL 的软件解决方案。 ICHEC 拥有具备不同领域、系统及软件专业技术的活跃工程师团队,始终致力提供金融、能源、生命科学和分析方面的设计服务。
金融、能源、生命科学、分析
Instigate Design
Instigate Design 专门从事电子系统、EDA 特定软件设计及并列编程的系统级设计。设计服务范围从软件设计及质量保证到综合应用工程设计无所不包,特别是音视频编码与通信。
高性能计算
MulticoreWare
MulticoreWare 不仅可开发和许可各种计算机视觉与视频处理库,同时还可为 Xilinx 客户提供设计服务。
音视频与广播、汽车与交通运输
Array Fire
ArrayFire 是高性能计算软件开发与编码服务的行业领导者。
消费类应用、工业科学医疗