Versal AI Edge 系列

为实时系统提供突破性的 AI 性能功耗比

产品优势

与领先的 GPU1 相比,Versal™ AI Edge 系列可为自动驾驶、预测工厂及医疗保健系统的实时系统、航空航天与国防的多任务负载以及广泛的其它应用提供 4 倍的 AI 性能功耗比。除 AI 外,Versal AI Edge 系列还可加速从传感器到人工智能,再到实时控制的整个应用,所有这些都具有最高级别的安全性和安防性,符合 ISO26262 和 IEC 61508 等重要标准。作为自适应计算加速平台 (ACAP),Versal AI Edge 系列允许开发者快速发展他们的传感器融合和 AI 算法,并利用业界可扩展性最高的器件系列,实现从边缘到端点的不同性能和电源配置。

Versal Premium

1: Versal AI Edge VE2802 vs. Jetson AGX Xavier (MAX N-Mode), ResNet50 224x224, batch=1

用于 112G PAM4 收发器的蓝色光纤电缆

标量引擎

标量引擎提供的高功效嵌入式计算可提供实时系统所需的安全性和安防性。双核 Arm® Cortex®-A72 应用处理器是运行 linux 类应用的理想选择,而双核 Arm Cortex-R5F 实时处理器则可针对最高级别的功能安全性(ASIL 和 SIL)运行安全性极为关键的代码。 平台管理控制器 (PMC) 基于三重冗余处理器,可管理器件工作,包括平台启动、高级电源及散热管理、安全性、安防性以及整个平台的可靠性等。

数字加密挂锁

自适应引擎

Versal 架构高灵活性的核心是其灵活应变的引擎,可以集成任何传感器,连接任何接口,并可实现处理任何工作负载的灵活性。灵活应变的引擎具有并行性和确定性功能,可实现并适应传感器融合算法,可加快整个流水线的前后数据处理,可执行确定性网络和实时响应的电机控制,可隔离故障安全工作的安全重要性功能,并支持硬件冗余和故障恢复。

intelligent-engines

智能引擎

智能引擎由 AI 引擎DSP 引擎组成,支持 AI 推断、图像处理和运动控制等边缘应用常见的广泛工作负载。AI 引擎是一种突破性的架构,基于可扩展的矢量处理器阵列和分布式内存,可提供突破性的 AI 性能功耗比。DSP 引擎基于上一代 Zynq™ 自适应 SoC 中经过验证的 Slice 架构,现在集成浮点支持,是无线信号处理和图像信号处理、数据分析以及运动控制等应用的理想选择。

 

safety-security

安全与安防

Versal ACAP 是针对工业和汽车应用中最严格的安全要求从头构建的,包括安全 ISO26262 和 IEC 61508,以及安防 IEC 62443 等。 Versal 架构按每个领域的安全特性以及全局资源进行了分区,可监控并消除常见原因的故障。与上一代自适应 SoC 相比,新安全特性可提高针对克隆、IP 盗用和网络攻击的保护,包括更高带宽的 AES 和 SHA 加密/解密,以及故障检测等。

accelerator-ram

加速器 RAM

加速器 RAM 具有 4MB 片上内存。所有计算引擎均可访问内存块,这有助于为 AI 推断等关键计算功能消除访问外部内存的需求。 这不仅可增强 Versal 架构中已有高灵活内存的层级,而且还可提高 AI 性能功耗比。加速器 RAM 也非常适合保持超过实时处理器 OCM 容量的安全关键性代码,可提高满足 ASIL-C 和 ASIL-D 要求的功能性。

programmable-io

可编程 I/O

Versal ACAP 的可编程 I/O 不仅允许连接任何传感器或接口,而且还可根据未来接口需求进行扩展。设计人员不仅可为传感器、内存或网络连接配置相同的 I/O,而且还可根据需要预算器件引脚。不同的 I/O 类型可针对原有标准和新一代标准提供广泛的速度和电压,例如,用于服务器级内存接口连接的 3.2Gb/s DDR、用于每针最高内存带宽的 4.2Gb/s LPDDR4x,以及用于处理高达 800 万像素传感器的原生 MIPI - 对于 Level-2 及更高等级的 ADAS 至关重要。


了解更多详情

 

应用

从边缘到端点的突破性计算性能

数据中心网络加速

ADAS 和自动驾驶

除了满足严格的散热、可靠性、安防和安全要求外,AI 计算性能也是目标为 SAE 3 级及以上安全等级的一级汽车厂商及 OEM 厂商的重要要求。Versal™ AI Edge 系列是针对功耗及散热限制系统的最高 AI 性能功耗比而构建的。作为一款异构计算平台,Versal AI Edge ACAP 可在整个车辆中为工作负载匹配正确的处理引擎:适用于任何所需雷达、激光雷达、红外线、GPS 及视觉传感器组合的定制 I/O;适用于传感器融合和预处理的灵活应变引擎;适用于推断和感知处理的 AI 引擎;以及适用于安全关键性决策的标量引擎。Versal AI Edge ACAP 是 AMD 汽车级 (XA) 产品组合的一部分,其架构符合严格的 ISO 26262 要求。


协作机器人

机器人技术将精确控制、确定性通信、机器视觉、响应性人工智能、网络安全和功能安全性整合在统一的“系统的系统”中。Versal AI Edge ACAP 可为机器人实现可扩展的模块化方法,能够为异构传感器的融合提供单个异构器件,以实现机器人感知、对数量可扩展轴的精确确定性控制、安全关键性功能隔离、运动规划加速,以及为基于环境的动态执行增强安全控制的人工智能。此外,Versal AI Edge 系列不仅可通过机器学习加速实时分析,以支持预测性维护,而且还可通过网络安全 (IEC 62443) 的网络连接实现可行的洞察。

数据中心网络加速

数据中心网络加速

无人机和多任务有效载荷

Versal AI Edge 系列针对实时、高性能应用进行了优化,适用于要求最高的环境,如多任务无人机和无人机等。 单个 Versal AI Edge 器件可支持多个输入,包括通信数据链、导航、用于目标跟踪的雷达和敌我识别 (IFF),以及用于目视侦察的光电传感器等。异构引擎可对输入的数据和传感器输入进行聚合和预处理,可执行波形处理和信号调节,而且最终可为目标跟踪和飞行路径优化以及认知 RF 执行低时延 AI,以识别敌对信号或信道攻击。Versal AI Edge 系列可提供多任务态势感知无人机所需的智能性和低 SWaP(尺寸、重量和功耗)。


超声成像

要求越来越多,因此医疗设备更小、便于携带,而且使用电池驱动,针对的护理点应用更多,所有这一切都不能影响患者的安全并仍能达到监管要求。Versal AI Edge 系列可为创建更高质量的图像与分析加速并行波束形成和实时图像处理,并可为使用寿命长的电池供电便携式超声单元提供高功率效率。作为一款异构计算平台,Versal AI Edge 系列可在流水线之间实现所有不同的结构。灵活应变的引擎可执行采集功能,包括对模拟前端的控制。AI 引擎不仅可加速高级成像技术,而且还可加速用于诊断辅助以及效率改进的机器学习。Arm® 子系统支持 Linux 类操作系统,用于跨数据流水线编排、更新和提供基础架构。Versal AI Edge 系列可从便携式扩展到台式,再扩展到车载超声波解决方案。了解更多

数据中心网络加速
产品表

Versal™ AI Edge 系列功能概述

AI / ML 性能

VE2002 VE2102 VE2202 VE2302 VE1752 VE2602 VE2802
AI 引擎 - INT8x4 (TOPS) 11 16 32 45 101 202 405
AI 引擎 - INT8 (TOPS) 5 8 16 23 101 101 202
DSP 引擎 – INT8 (TOPS) 0.6 1.2 2.2 3.2 9.1 6.8 9.1
灵活应变的引擎 – INT4 (TOPS) 2 5 13 19 56 47 65
灵活应变的引擎 – INT8 (TOPS) 1 1 3 5 14 12 17

标量引擎功能

VE2002 VE2102 VE2202 VE2302 VE1752 VE2602 VE2802
应用处理单元 双核 Arm® Cortex -A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC
实时处理单元 双核 Arm® Cortex -R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM
存储器 支持 ECC 的 256KB 片上内存
连接功能 Ethernet (x2); UART (x2); CAN-FD (x2); USB 2.0 (x1); SPI (x2); I2C (x2)

智能引擎功能

VE2002 VE2102 VE2202 VE2302 VE1752 VE2602 VE2802
AI 引擎 - ML 5 12 24 34 0 152 304
AI 引擎 0 0 0 0 304 0 0
DSP 引擎 90 176 324 464 1,312 984 1,312

灵活应变的引擎功能

VE2002 VE2102 VE2202 VE2302 VE1752 VE2602 VE2802
系统逻辑单元 (K) 44 80 230 329 981 820 1,139
LUT 20,000 36,608 105,000 150,272 448,512 375,000 520,704

平台功能

VE2002 VE2102 VE2202 VE2302 VE1752 VE2602 VE2802
加速器 RAM (Mb) 32 32 32 32 0 0 0
总内存 (Mb) 46 54 86 103 253 243 263
NoC 主 / NoC 从端口 2 2 5 5 21 21 21
CCIX & PCIe® (带有 DMA) (CPM) - - - - 1 x Gen4x16,
CCIX
1 x Gen4x16,
CCIX
1 x Gen4x16,
CCIX
PCI Express® - - 1 x Gen4x8​ 1x Gen4x8 4x
Gen4x8
4x Gen4x8 4x Gen4x8
40G 多速率以太网 MAC 0 0 1 1 2 2 2
视频解码器引擎 (VDE) - - - - - 2 4
GTY 收发器 0 0 0 0 44 0 0
GTYP 收发器 0 0 8 8 0 32 32
技术文档

技术文档


Versal 设计指南和文档

AMD 提供各类文档、资源和设计方法,以协助您使用 Versal 架构进行开发。 如果您未曾使用 Versal ACAP 进行开发,您可以使用提供交互式指导的设计流程助手来制定您的开发策略。 设计流程中心按设计流程组织和显示所有 Versal 文档,以便您立即获得所需的信息。


Default Default 标题 文件类型 日期
开始设计

早期访问计划

Versal™ AI Edge 系列目前处于早期访问阶段。请联系您当地的 AMD 销售代表申请早期访问计划或访问联系销售页面。欢迎利用以下资源进一步了解 Versal ACAP 架构的设计工具和设计方法。


面向所有开发者的集成型软硬件平台

Versal ACAP 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 Vivado™ ML 版引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado ML 版 >

Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。作为开源社区中引以为傲的一员,Vitis 统一软件平台不仅免费,而且还提供一系列性能优化的广泛开源库,这些库可提供开创性加速,对于现有应用而言,代码修改很少,甚至无需修改。
下载 Vitis™ 统一软件平台 >

Versal AI Prime 系列

使用 Versal AI Core VCK190 Core 评估套件开始开发

面向 Versal AI Edge 器件的设计人员现在可使用 Versal AI 内核 VCK190 评估套件启动设计。Versal AI Edge 器件基于与 Versal AI 内核系列相同的架构,支持通用架构模块,如标量引擎(Arm® 处理子系统)、灵活应变的引擎(可编程逻辑)、AI 引擎 *、片上网络(可编程 NoC)以及连接模块(包括 PCIe® 和 DDR4 等)。评估套件拥有启动设计所需的一切,包括执行系统测试、评估关键接口以及采用 ACAP 设计方法的功能。Versal AI Edge ACAP 评估套件将于 2022 年下半年提供。

了解更多有关 Versal AI Core 系列 VCK190 评估套件的信息 >

* AI 引擎在 VE1752 器件中提供;所有其它 Versal AI Edge 器件都支持 AI 引擎 ML。



Versal 设计指南和文档

AMD 提供各类文档、资源和设计方法,以协助您使用 Versal 架构进行开发。 如果您未曾使用 Versal ACAP 进行开发,您可以使用提供交互式指导的设计流程助手来制定您的开发策略。 设计流程中心按设计流程组织和显示所有 Versal 文档,以便您立即获得所需的信息。

视频

重要视频


所有视频

Default Default 标题 日期