TDA4VPE-Q1 采用 Quad Arm® Cortex-A72®、16 TOPS AI、C7xDSP 和 GPU 的 SoC技术手册

描述

TDA4VPE-Q1 TDA4APE-Q1 处理器系列基于进化的 Jacinto™ 7 架构,面向 ADAS 和自动驾驶汽车 (AV) 应用,并建立在 TI 十多年来在 ADAS 处理器市场领导地位积累的广泛市场知识之上。在符合功能安全的目标架构中,高性能计算、深度学习引擎、用于信号和图像处理的专用加速器的独特组合使 TDA4VPE-Q1 TDA4APE-Q1 器件非常适合多种成像、视觉、雷达、传感器融合和 AI 应用,例如:机器人、移动机械、非公路车辆控制器、机器视觉、AI BOX、网关、零售自动化、医学成像等。TDA4VPE-Q1 TDA4APE-Q1 以行业领先的功耗/性能比为传统和深度学习算法提供高性能计算,并具有高水平的系统集成度,可为支持集中式 ECU 或独立传感器中多种传感器模式的高级汽车平台实现可扩展性和降低成本。关键内核包括具有标量和矢量内核的下一代 DSP、专用深度学习和传统算法加速器、用于通用计算的最新 Arm 和 GPU 处理器、集成的下一代成像子系统 (ISP)、视频编解码器、以太网集线器和隔离的 MCU 岛。所有这些都受到汽车级安全和安保硬件加速器的保护。
*附件:tda4vpe-q1.pdf

关键性能核心概述

“C7x”下一代 DSP 将 TI 业界领先的 DSP 和 EVE 内核整合到一个更高性能的内核中,并增加了浮点矢量计算功能,从而实现了传统代码的向后兼容性,同时简化了软件编程。新型“MMAv2”深度学习加速器的单个实例可在 125°C 的典型汽车最坏情况结温下运行时,在业界最低的功耗范围内实现高达 8 TOPS 的性能。专用的 ADAS/AV 硬件加速器提供视觉预处理以及距离和运动处理,而不会影响系统性能。

常规计算核心和集成概述

Arm Cortex-A72 的独立四核集群配置促进了多作系统应用,而对软件管理程序的需求极低。四个 Arm® Cortex-R5F® 子系统支持低级、定时关键处理任务,使 Arm® Cortex-A72® 不受应用的阻碍。集成的 IMG BXS-4-64 GPU 提供高达 50GFLOPS 的速度,可实现动态 3D 渲染,从而增强查看应用。TI 的第 7 代 ISP 基于现有的世界级 ISP 构建,具有处理更广泛传感器套件的灵活性、对更高位深度的支持以及针对分析应用的功能。集成的诊断和安全功能支持高达 ASIL-D/SIL-3 级别的作,而集成的安全功能可保护数据免受现代攻击。为了支持需要大量数据带宽的系统,包括一个 PCIe 集线器和千兆以太网交换机以及 CSI-2 端口,以支持许多传感器输入的吞吐量。为了进一步集成,TDA4VPE-Q1 TDA4APE-Q1 系列还包括一个 MCU 岛,无需外部系统微控制器。

特性

处理器内核:

  • 多达三个 C7x 浮点、矢量 DSP、高达 1.0GHz、240GFLOPS、768GOPS

  • 多达两个深度学习矩阵乘法加速器 (MMAv2),1.0GHz 时高达 16TOPS (8b)

  • 多达两个带图像信号处理器 (ISP) 和多个视觉辅助加速器的视觉处理加速器 (VPAC)

  • 深度和运动处理加速器 (DMPAC)

  • 四个 Arm Cortex-A72 微处理器子系统,频率高达 2.0GHz

    • 每个四核 Cortex-A72 集群 2MB 共享 L2 缓存
    • 每个 Cortex-A72 内核 32KB L1 DCache 和 48KB L1 ICache
  • 八个 Arm Cortex-R5F MCU,频率高达 1.0GHz

    • 16K I-Cache、16K D-Cache、64K L2 TCM
    • 隔离式 MCU 子系统中的两个 Arm Cortex-R5F MCU
    • 通用计算分区中的六个 Arm Cortex-R5F MCU
  • GPU IMG BXS-4-64,256kB 缓存,高达 800MHz,50GFLOPS,4GTexels/s (TDA4VPE)

  • 定制设计的互连结构,支持接近最大处理授权内存子系统:

  • 高达 8MB 的片上 L3 RAM,具有 ECC 和一致性

    • ECC 错误保护
    • 共享相干缓存
    • 支持内部 DMA 引擎
  • 多达两个带 ECC 的外部存储器接口 (EMIF) 模块

    • 支持 LPDDR4 内存类型
    • 支持高达 4266MT/s 的速度
    • 多达 2x32-b 总线,内联 ECC 速度高达 34GB/s
  • 通用内存控制器 (GPMC)

  • 主域中的 3x512KB 片上 SRAM,受 ECC 保护功能安全:

  • 符合功能安全标准(在特定部件号上)

    • 专为功能安全应用而开发
    • 提供文档,以帮助 ISO 26262 功能安全系统设计,最高可达 ASIL-D/SIL-3 目标
    • 系统能力高达 ASIL-D/SIL-3 靶向
    • 硬件完整性高达 ASIL-D/SIL-3,适用于 MCU 域
    • 硬件完整性高达 ASIL-B/SIL-2,针对主域
    • 硬件完整性高达 ASIL-D/SIL-3,适用于主域的扩展 MCU (EMCU) 部分
    • 安全相关认证
      • 计划通过 ISO 26262
  • AEC-Q100 符合 Q1 结尾的部件号变体设备安全性(在特定部件号上):

  • 具有安全运行时支持的安全启动

  • 客户可编程根密钥,最高可达 RSA-4K 或 ECC-512

  • 嵌入式硬件安全模块

  • 加密硬件加速器 – 具有 ECC、AES、SHA、RNG、DES 和 3DES 的 PKA高速串行接口:

  • 集成以太网交换机,支持 4 个外部端口

    • 两个端口支持 5Gb、10Gb USXGMII/XFI
    • 所有端口均支持 1Gb、2.5Gb SGMII
    • 所有端口均可支持 QSGMII。最多可以启用 1 个 QSGMII,并使用所有 4 个内部通道
  • 多达 2 个 2 个 2L/1 个 4 个 PCI-Express (PCIe) Gen3 控制器

    • 具有自动协商功能的 Gen1 (2.5GT/s)、Gen2 (5.0GT/s) 和 Gen3 (8.0GT/s)作
  • 一个 USB 3.0 双角色设备 (DRD) 子系统

    • 增强型 SuperSpeed Gen1 端口
    • 支持Type-C切换
    • 可独立配置为 USB 主机、USB 外设或 USB DRD
  • 三个 CSI2.0 4L 摄像头串行接口 RX (CSI-RX) 和两个带 DFY 的 CSI2.0 4L TX (CSI-TX)

    • 符合 MIPI CSI 1.3 + MIPI-DPHY 1.2 标准
    • CSI-RX 支持 1、2、3 或 4 个数据通道模式,每通道高达 2.5Gbps
    • CSI-TX 支持 1、2 或 4 个数据通道模式,每通道高达 2.5Gbps

    以太网:

  • 两个 RGMII/RMII 接口汽车接口:

  • 20 个模块化控制器局域网 (MCAN) 模块,完全支持 CAN-FD显示子系统:

  • 两个 DSI 4L TX(高达 2.5k)

  • 一个 eDP/DP 接口,支持多显示器 (MST)

  • 一个 DPI音频接口:

  • 五个多通道音频串行端口 (MCASP) 模块视频加速:

  • H.264/H.265 编码/解码,高达 960MP/s闪存接口:

  • 嵌入式多媒体卡接口 (eMMC™ 5.1)

  • 一个安全数字 3.0 / 安全数字输入输出 3.0 接口 (SD3.0/SDIO3.0

  • 具有两个通道的通用闪存 (UFS 2.1) 接口

  • 两个独立的闪存接口配置为

    • 一个 OSPI 或 HyperBus™ 或 QSPI 闪存接口,以及
    • 一个 QSPI 闪存接口

    片上系统 (SoC) 架构:

  • 16纳米FinFET技术

  • 27mm × 27mm、0.8 mm 间距、1063 引脚 FCBGA (AND),支持 IPC 3 类 PCB 布线TPS6594-Q1配套电源管理IC (PMIC):

  • 功能安全支持高达 ASIL-D

  • 灵活的映射以支持不同的用例

参数
adas

方框图

adas

1. 核心特性

  • 处理器核心‌:
    • C7x DSP‌:支持浮点运算与向量处理,最高1.0GHz,性能达240GFLOPS/768GOPS。
    • 深度学习加速器(MMAv2) ‌:双核配置,最高16TOPS(8位精度)。
    • 视觉处理加速器(VPAC) ‌:集成ISP及多路视觉辅助加速器。
    • Arm® Cortex®-A72‌:四核集群,主频2.0GHz,共享L2缓存。
    • Arm® Cortex®-R5F‌:八核MCU,支持隔离与通用计算分区。
  • 内存子系统‌:
    • 片上L3 RAM容量达8MB(带ECC),支持LPDDR4(最高4266MT/s)。
    • 集成DMA引擎与双通道外部内存接口(EMIF)。
  • 功能安全‌:
    • 符合ISO 26262标准,支持ASIL-D/SIL-3(MCU域)与ASIL-B/SIL-2(主域)。
    • AEC-Q100认证(Q1后缀型号)。
  • 安全与接口‌:
    • 安全启动、硬件加密引擎(AES/SHA/RSA-4K)。
    • 高速串行接口:PCIe Gen3、USB 3.0、以太网交换(支持10GbE)、MIPI CSI-2/DSI。

2. 应用场景

  • 汽车电子‌:
    • 高级驾驶辅助系统(ADAS):环视、传感器融合、前视摄像头。
    • 自动驾驶:雷达/LiDAR感知、域控制器。
  • 工业与机器人‌:
    • 机器视觉、移动机械控制、医疗成像。

3. 关键架构

  • 异构计算‌:
    • DSP+GPU+加速器协同处理,优化AI与实时任务。
    • 独立MCU岛设计,减少对外部微控制器的依赖。
  • 能效比‌:
    • 16nm FinFET工艺,集成电源管理IC(PMIC),支持高温环境(125°C)。

4. 封装与配置

  • 封装‌:27mm×27mm FCBGA,1063引脚。
  • 型号差异‌:
    • TDA4VPE6/TDA4APE6:支持三核C7x DSP,8TOPS深度学习。
    • TDA4VPE4/TDA4APE4:双核C7x DSP,功能精简。

5. 开发支持

  • 工具链‌:TI提供SDK,包含软件构建表(Software Build Sheet)。
  • 文档‌:详细引脚配置、电气特性及安全认证指南。
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分