ai芯片技术架构有哪些？FPGA芯片定义及结构分析

牛牛牛 2023-08-05 11086

描述

　　ai芯片技术架构有哪些？

　　AI芯片的技术架构可以根据其设计方式和特点进行分类。以下是几种常见的AI芯片技术架构：

　　1. GPU（图形处理器）架构：GPU最初是用于图形渲染和游戏处理的，但由于其高度并行的特性，逐渐被应用于深度学习计算。GPU架构采用多个计算单元（CUDA核心）进行并行计算，能够高效地执行浮点运算和矩阵计算。NVIDIA的Tensor Core技术进一步优化了GPU的深度学习计算能力。

　　2. FPGA（现场可编程门阵列）架构：FPGA是一种可以根据需要编程和重新配置的硬件。AI芯片中的FPGA架构允许开发者将深度学习模型转换为硬件电路，以实现高度定制化和低功耗的计算。FPGA具有可重构性，可以根据需要灵活调整电路结构。

　　3. ASIC（专用集成电路）架构：ASIC是指专门为特定应用设计和制造的定制芯片。AI芯片中的ASIC架构基于特定的深度学习算法和网络结构进行优化，通过专用硬件实现高效计算和推理。ASIC通常能够提供更高的性能和能效比，但研发和生产成本较高。

　　4. NPU（神经网络处理器）架构：NPU是专门为加速神经网络运算而设计的硬件架构。NPU具有高度并行的计算单元，并针对深度学习计算进行了优化，如卷积计算、矩阵乘法和张量处理等。NPU可实现高效的神经网络推理和训练。

　　5. DSP（数字信号处理器）架构：DSP广泛应用于信号处理和音频处理领域，也被用于一些AI应用。DSP架构通过并行计算和高速运算单元，支持复杂的算术运算和信号处理操作，可加速深度学习推理任务。

　　这些AI芯片技术架构都有各自的特点和优势，可以根据应用需求选择合适的架构。同时，一些AI芯片采用了混合架构，结合了多种硬件类型和优化策略，以实现更灵活、高效的计算能力。

　　芯片的架构是什么意思

　　芯片的架构指的是芯片内部的设计和组织方式，包括电路结构、功能模块、数据通路和控制单元等方面的内容。芯片的架构决定了芯片的性能、功能和能效等特性。

　　具体来说，芯片的架构涉及以下几个方面：

　　1. 功能模块：芯片的架构确定了芯片集成的各种功能模块，如CPU核心、内存控制器、输入输出接口等。不同的应用需求可能需要不同的功能模块组合。

　　2. 数据通路：芯片的架构描述了数据在芯片内部的流动路径和处理过程。数据通路包括寄存器、运算单元、数据缓存等，用于数据传输、运算和存储。

　　3. 控制单元：芯片的架构中包含了控制单元，用于管理和协调芯片内各个功能模块的工作。控制单元负责指令解析、流水线调度、时序控制等任务，确保芯片能够按照预定流程进行工作。

　　4. 性能特性：芯片的架构直接影响了芯片的性能特性，如时钟频率、运算能力、存储容量等。合理的架构设计可以提高芯片的性能，并满足特定应用场景的需求。

　　5. 能效特性：芯片的架构也与芯片的能效密切相关。有效的架构设计可以降低功耗，提高能效比，使芯片在给定的能耗下实现更高的性能。

　　芯片的架构设计需要综合考虑应用场景、性能要求、功耗限制等多个因素。不同的架构设计可以在不同的应用领域中发挥优势，满足不同的需求。

　　FPGA芯片定义及结构

　　FPGA（Field-Programmable Gate Array），即现场可编程门阵列，它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。

　　FPGA芯片主要由6部分完成，分别为：可编程输入输出单元、基本可编程逻辑单元、完整的时钟管理、嵌入块式RAM、丰富的布线资源、内嵌的底层功能单元和内嵌专用硬件模块。目前主流的FPGA仍是基于查找表技术的，已经远远超出了先前版本的基本性能，并且整合了常用功能（如RAM、时钟管理和DSP）的硬核（ASIC型）模块。

　　FPGA工作原理

　　由于FPGA需要被反复烧写，它实现组合逻辑的基本结构不可能像ASIC那样通过固定的与非门来完成，而只能采用一种易于反复配置的结构。查找表可以很好地满足这一要求，目前主流FPGA都采用了基于SRAM工艺的查找表结构，也有一些军品和宇航级FPGA采用Flash或者熔丝与反熔丝工艺的查找表结构。通过烧写文件改变查找表内容的方法来实现对FPGA的重复配置。

　　查找表（Look-Up-Table）简称为LUT，LUT本质上就是一个RAM。目前FPGA中多使用4输入的LUT，所以每一个LUT可以看成一个有4位地址线的RAM。当用户通过原理图或HDL语言描述了一个逻辑电路以后，PLD/FPGA开发软件会自动计算逻辑电路的所有可能结果，并把真值表（即结果）事先写入RAM，这样，每输入一个信号进行逻辑运算就等于输入一个地址进行查表，找出地址对应的内容，然后输出即可。

　　可编程输入/输出单元简称I/O单元，是芯片与外界电路的接口部分，完成不同电气特性下对输入/输出信号的驱动与匹配要求。FPGA内的I/O按组分类，每组都能够独立地支持不同的I/O标准。通过软件的灵活配置，可适配不同的电气标准与 I/O物理特性，可以调整驱动电流的大小，可以改变上、下拉电阻。目前，I/O口的频率也越来越高，一些高端的FPGA通过DDR寄存器技术可以支持高达2Gbps的数据速率。

　　CLB是FPGA内的基本逻辑单元。CLB的实际数量和特性会依器件的不同而不同，但是每个CLB都包含一个可配置开关矩阵，此矩阵由4或6个输入、一些选型电路（多路复用器等）和触发器组成。开关矩阵是高度灵活的，可以对其进行配置以便处理组合逻辑、移位寄存器或RAM。在Xilinx公司的FPGA器件中，CLB由多个（一般为4个或2个）相同的Slice和附加逻辑构成。每个CLB模块不仅可以用于实现组合逻辑、时序逻辑，还可以配置为分布式RAM和分布式ROM。

　　自动驾驶的“芯”杀手

　　自动驾驶和高级驾驶辅助系统（ADAS）细分市场正在经历蜕变，对计算和传感器功能提出了新的复杂需求。FPGA拥有其他芯片解决方案无法比拟的独特优势，是满足自动驾驶行业不断发展变化的优良选择。FPGA是芯片领域的一种特殊技术，一方面能够通过软件工具进行反复多次配置，另一方面拥有丰富的IO接口和计算单元。因此，FPGA能够根据应用场景的具体需求，同时处理流水线并行和数据并行，天生具有计算性能高、延迟低、功耗小等优势。

　　FPGA具备高吞吐量、高能效以及实时处理等多项优点，非常契合自动驾驶所需要的技术需求。高级辅助驾驶系统（ADAS）、车载体验（IVE）应用的标准和要求正在快速演变，系统设计人员关注的问题主要包括出色的灵活性和更快的开发周期，同时维持更高的性能功耗比。通过可重新编程的FPGA和不断增多的汽车级产品相结合，支持汽车设计师满足设计要求，在不断变化的汽车行业中始终保持领先。

　　适应性更强的平台

　　对于自动驾驶芯片来说真正的价值在于计算引擎的利用率，即理论性能和实际性能之间的差异。FPGA包含大量的路由链路以及大量的小型存储。这些资源的组合使设计人员能够为其计算引擎创建定制的数据馈送网络，以获得更高的利用水平。可编程逻辑为客户提供了高度的灵活性，以适应ADAS和自动驾驶等新兴应用领域不断变化的需求。利用改进的接口标准、算法创新和新的传感器技术，都需要适应性强的平台，不仅可以支持软件更改，还可以支持硬件更改，而这正是FPGA芯片的优势所在。

　　FPGA芯片拥有可扩展性。可拓展的芯片改变了可编程逻辑的数量，大多采用引脚兼容的封装。这意味着开发人员可以创建单个ECU平台来承载低、中、高版本的ADAS功能包，并根据需要通过选择所需的最小密度芯片来缩放成本。

　　差异化解决方案

　　FPGA芯片允许开发人员创建独特的差异化处理解决方案，这些解决方案可以针对特定应用或传感器进行优化。这对于ASSP芯片来说是无法实现的，即使是那些提供专用加速器的芯片，它们的使用方式也受到限制，而且基本上可以提供给所有竞争对手。例如Xilinx的长期客户已经创建了只有他们可以访问的高价值IP库，并且这些功能可以被公司的各种产品使用。从90nm节点开始，对于大批量汽车应用，Xilinx的芯片就已经极具成本效益，有超过1.6亿颗Xilinx芯片在该行业获得应用。

　　编辑：黄飞

打开APP阅读更多精彩内容