与领先的 GPU1 相比,Versal™ AI Edge 系列可为自动驾驶、预测工厂及医疗保健系统的实时系统、航空航天与国防的多任务负载以及广泛的其它应用提供 4 倍的 AI 性能功耗比。除 AI 外,Versal AI Edge 系列还可加速从传感器到人工智能,再到实时控制的整个应用,所有这些都具有最高级别的安全性和安防性,符合 ISO26262 和 IEC 61508 等重要标准。作为自适应计算加速平台 (ACAP),Versal AI Edge 系列允许开发者快速发展他们的传感器融合和 AI 算法,并利用业界可扩展性最高的器件系列,实现从边缘到端点的不同性能和电源配置。
1: Versal AI Edge VE2802 vs. Jetson AGX Xavier (MAX N-Mode), ResNet50 224x224, batch=1
标量引擎提供的高功效嵌入式计算可提供实时系统所需的安全性和安防性。双核 Arm® Cortex®-A72 应用处理器是运行 linux 类应用的理想选择,而双核 Arm Cortex-R5F 实时处理器则可针对最高级别的功能安全性(ASIL 和 SIL)运行安全性极为关键的代码。 平台管理控制器 (PMC) 基于三重冗余处理器,可管理器件工作,包括平台启动、高级电源及散热管理、安全性、安防性以及整个平台的可靠性等。
Versal 架构高灵活性的核心是其灵活应变的引擎,可以集成任何传感器,连接任何接口,并可实现处理任何工作负载的灵活性。灵活应变的引擎具有并行性和确定性功能,可实现并适应传感器融合算法,可加快整个流水线的前后数据处理,可执行确定性网络和实时响应的电机控制,可隔离故障安全工作的安全重要性功能,并支持硬件冗余和故障恢复。
Versal ACAP 是针对工业和汽车应用中最严格的安全要求从头构建的,包括安全 ISO26262 和 IEC 61508,以及安防 IEC 62443 等。
Versal 架构按每个领域的安全特性以及全局资源进行了分区,可监控并消除常见原因的故障。与上一代自适应 SoC 相比,新安全特性可提高针对克隆、IP 盗用和网络攻击的保护,包括更高带宽的 AES 和 SHA 加密/解密,以及故障检测等。
加速器 RAM 具有 4MB 片上内存。所有计算引擎均可访问内存块,这有助于为 AI 推断等关键计算功能消除访问外部内存的需求。
这不仅可增强 Versal 架构中已有高灵活内存的层级,而且还可提高 AI 性能功耗比。加速器 RAM 也非常适合保持超过实时处理器 OCM 容量的安全关键性代码,可提高满足 ASIL-C 和 ASIL-D 要求的功能性。
Versal ACAP 的可编程 I/O 不仅允许连接任何传感器或接口,而且还可根据未来接口需求进行扩展。设计人员不仅可为传感器、内存或网络连接配置相同的 I/O,而且还可根据需要预算器件引脚。不同的 I/O 类型可针对原有标准和新一代标准提供广泛的速度和电压,例如,用于服务器级内存接口连接的 3.2Gb/s DDR、用于每针最高内存带宽的 4.2Gb/s LPDDR4x,以及用于处理高达 800 万像素传感器的原生 MIPI - 对于 Level-2 及更高等级的 ADAS 至关重要。
除了满足严格的散热、可靠性、安防和安全要求外,AI 计算性能也是目标为 SAE 3 级及以上安全等级的一级汽车厂商及 OEM 厂商的重要要求。Versal™ AI Edge 系列是针对功耗及散热限制系统的最高 AI 性能功耗比而构建的。作为一款异构计算平台,Versal AI Edge ACAP 可在整个车辆中为工作负载匹配正确的处理引擎:适用于任何所需雷达、激光雷达、红外线、GPS 及视觉传感器组合的定制 I/O;适用于传感器融合和预处理的灵活应变引擎;适用于推断和感知处理的 AI 引擎;以及适用于安全关键性决策的标量引擎。Versal AI Edge ACAP 是 AMD 汽车级 (XA) 产品组合的一部分,其架构符合严格的 ISO 26262 要求。
机器人技术将精确控制、确定性通信、机器视觉、响应性人工智能、网络安全和功能安全性整合在统一的“系统的系统”中。Versal AI Edge ACAP 可为机器人实现可扩展的模块化方法,能够为异构传感器的融合提供单个异构器件,以实现机器人感知、对数量可扩展轴的精确确定性控制、安全关键性功能隔离、运动规划加速,以及为基于环境的动态执行增强安全控制的人工智能。此外,Versal AI Edge 系列不仅可通过机器学习加速实时分析,以支持预测性维护,而且还可通过网络安全 (IEC 62443) 的网络连接实现可行的洞察。
Versal AI Edge 系列针对实时、高性能应用进行了优化,适用于要求最高的环境,如多任务无人机和无人机等。 单个 Versal AI Edge 器件可支持多个输入,包括通信数据链、导航、用于目标跟踪的雷达和敌我识别 (IFF),以及用于目视侦察的光电传感器等。异构引擎可对输入的数据和传感器输入进行聚合和预处理,可执行波形处理和信号调节,而且最终可为目标跟踪和飞行路径优化以及认知 RF 执行低时延 AI,以识别敌对信号或信道攻击。Versal AI Edge 系列可提供多任务态势感知无人机所需的智能性和低 SWaP(尺寸、重量和功耗)。
要求越来越多,因此医疗设备更小、便于携带,而且使用电池驱动,针对的护理点应用更多,所有这一切都不能影响患者的安全并仍能达到监管要求。Versal AI Edge 系列可为创建更高质量的图像与分析加速并行波束形成和实时图像处理,并可为使用寿命长的电池供电便携式超声单元提供高功率效率。作为一款异构计算平台,Versal AI Edge 系列可在流水线之间实现所有不同的结构。灵活应变的引擎可执行采集功能,包括对模拟前端的控制。AI 引擎不仅可加速高级成像技术,而且还可加速用于诊断辅助以及效率改进的机器学习。Arm® 子系统支持 Linux 类操作系统,用于跨数据流水线编排、更新和提供基础架构。Versal AI Edge 系列可从便携式扩展到台式,再扩展到车载超声波解决方案。了解更多
VE2002 | VE2102 | VE2202 | VE2302 | VE1752 | VE2602 | VE2802 | |
---|---|---|---|---|---|---|---|
AI 引擎 - INT8x4 (TOPS) | 11 | 16 | 32 | 45 | 101 | 202 | 405 |
AI 引擎 - INT8 (TOPS) | 5 | 8 | 16 | 23 | 101 | 101 | 202 |
DSP 引擎 – INT8 (TOPS) | 0.6 | 1.2 | 2.2 | 3.2 | 9.1 | 6.8 | 9.1 |
灵活应变的引擎 – INT4 (TOPS) | 2 | 5 | 13 | 19 | 56 | 47 | 65 |
灵活应变的引擎 – INT8 (TOPS) | 1 | 1 | 3 | 5 | 14 | 12 | 17 |
VE2002 | VE2102 | VE2202 | VE2302 | VE1752 | VE2602 | VE2802 | |
---|---|---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex -A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | ||||||
实时处理单元 | 双核 Arm® Cortex -R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM | ||||||
存储器 | 支持 ECC 的 256KB 片上内存 | ||||||
连接功能 | Ethernet (x2); UART (x2); CAN-FD (x2); USB 2.0 (x1); SPI (x2); I2C (x2) |
VE2002 | VE2102 | VE2202 | VE2302 | VE1752 | VE2602 | VE2802 | |
---|---|---|---|---|---|---|---|
AI 引擎 - ML | 5 | 12 | 24 | 34 | 0 | 152 | 304 |
AI 引擎 | 0 | 0 | 0 | 0 | 304 | 0 | 0 |
DSP 引擎 | 90 | 176 | 324 | 464 | 1,312 | 984 | 1,312 |
VE2002 | VE2102 | VE2202 | VE2302 | VE1752 | VE2602 | VE2802 | |
---|---|---|---|---|---|---|---|
系统逻辑单元 (K) | 44 | 80 | 230 | 329 | 981 | 820 | 1,139 |
LUT | 20,000 | 36,608 | 105,000 | 150,272 | 448,512 | 375,000 | 520,704 |
VE2002 | VE2102 | VE2202 | VE2302 | VE1752 | VE2602 | VE2802 | |
---|---|---|---|---|---|---|---|
加速器 RAM (Mb) | 32 | 32 | 32 | 32 | 0 | 0 | 0 |
总内存 (Mb) | 46 | 54 | 86 | 103 | 253 | 243 | 263 |
NoC 主 / NoC 从端口 | 2 | 2 | 5 | 5 | 21 | 21 | 21 |
CCIX & PCIe® (带有 DMA) (CPM) | - | - | - | - | 1 x Gen4x16, CCIX |
1 x Gen4x16, CCIX |
1 x Gen4x16, CCIX |
PCI Express® | - | - | 1 x Gen4x8 | 1x Gen4x8 | 4x Gen4x8 |
4x Gen4x8 | 4x Gen4x8 |
40G 多速率以太网 MAC | 0 | 0 | 1 | 1 | 2 | 2 | 2 |
视频解码器引擎 (VDE) | - | - | - | - | - | 2 | 4 |
GTY 收发器 | 0 | 0 | 0 | 0 | 44 | 0 | 0 |
GTYP 收发器 | 0 | 0 | 8 | 8 | 0 | 32 | 32 |
Versal™ AI Edge 系列目前处于早期访问阶段。请联系您当地的 AMD 销售代表申请早期访问计划或访问联系销售页面。欢迎利用以下资源进一步了解 Versal ACAP 架构的设计工具和设计方法。
Versal ACAP 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 Vivado™ ML 版引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado ML 版 >
Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。作为开源社区中引以为傲的一员,Vitis 统一软件平台不仅免费,而且还提供一系列性能优化的广泛开源库,这些库可提供开创性加速,对于现有应用而言,代码修改很少,甚至无需修改。
下载 Vitis™ 统一软件平台 >
面向 Versal AI Edge 器件的设计人员现在可使用 Versal AI 内核 VCK190 评估套件启动设计。Versal AI Edge 器件基于与 Versal AI 内核系列相同的架构,支持通用架构模块,如标量引擎(Arm® 处理子系统)、灵活应变的引擎(可编程逻辑)、AI 引擎 *、片上网络(可编程 NoC)以及连接模块(包括 PCIe® 和 DDR4 等)。评估套件拥有启动设计所需的一切,包括执行系统测试、评估关键接口以及采用 ACAP 设计方法的功能。Versal AI Edge ACAP 评估套件将于 2022 年下半年提供。
了解更多有关 Versal AI Core 系列 VCK190 评估套件的信息 >
* AI 引擎在 VE1752 器件中提供;所有其它 Versal AI Edge 器件都支持 AI 引擎 ML。
AMD 培训和学习资源提供了实用的实践技能和基础知识,可助力开发者在下一个开发项目中充分发挥生产力。
Versal™ ACAP 平台快速上手
使用 Versal ACAP 进行设计:架构和方法
使用 Versal ACAP 进行设计:可编程片上网络
使用 Versal ACAP 进行设计 - 电源和开发板设计
使用 Versal AI 引擎进行设计 1 :架构与设计流程
使用 Versal AI 引擎进行设计 2:使用 AI 引擎内核进行图形编程
使用 Versal AI 引擎进行设计 3 – 内核编程和优化