概述
vitis-blas-library

Vitis™ BLAS 库是标准基本线性代数子程序 (BLAS) 的性能优化实现方案,旨在为多种不同的应用(如基于多层感知器 (MLP) 的机器学习、计算机视觉和定量金融等)带来 Xilinx 平台上的开箱即用加速。

Vitis BLAS 库 API(如通用矩阵乘法 (GEMM) 和通用矩阵向量乘法 (GEMV))可用作支持 C、C++ 和 Python 函数接口的预编译加速器。直接在应用中调用它们,无需任何额外的硬件配置。使用 Vitis BLAS 库 API 嵌入并替换 CPU 和基于 GPU 的 BLAS 运算,以快速针对 Xilinx 平台的性能优势进行原型设计和评估。

Vitis BLAS 库原语及内核不仅可提高灵活性和控制性,同时还可设计自己独特的加速算法,用于在边缘、本地或云部署。


性能基准

矩阵大小 Vitis BLAS GEMM API
(Tops/Sec)
Intel® MKL(16 个线程,无缓存)(Tops/Sec) 加速
256 0.059195 0.001 59x
512 0.287016 0.02 14x

数据类型: int16
CPU: 2 Intel(R) Xeon(R) CPU E5-2640 v3 @2.60GHz,每个处理器 8 个内核,每个内核 2 个线程。
Xilinx:Vitis BLAS 库 v1.0 在 Alveo U200 运行
FPGA 执行时间包括主机与器件之间的数据传输

入门