基于M-DSP的浮点乘累加器设计

消耗积分:3 | 格式:rar | 大小:0.98 MB | 2017-12-14

分享资料个

　　数字信号处理器（Digital Signal Processor．DSP）从专用信号处理器开始发展到今天的超长指令字（ Very Long　Instruction Word．VLIW）阵列处理器，其应用领域已经从最初的语音、声纳等低频信号的处理发展到今天雷达、图像等视频大数据量的信号处理。由于浮点运算和并行处理技术的应用，信号处理能力已得到极大的提高。随着数字信号处理器在处理速度和运算精度两个方向的发展，体系结构中数据流结构甚至人工神经网络结构等，将可能成为下一代数字信号处理器的基本结构模式。近些年，从传统DSP结构中已不能有效地提高DSP处理器的性能，许多新的提高DSP性能的方法被提出。其中提高频率的方法已达到瓶颈阶段，最有效的途径是提高并行性。数字信号处理领域的核心算法根据运算类型可以分为两大类：一类是以密集的浮点乘加运算为典型的信号处理算法，包括快速傅里叶变换（ Fast Fourier　Transformation，FFT）、有限冲激响应（ Finite Impulse　Response，FIR）和离散傅里叶变换（Discrete Fourier Transform，　DFT）等算法；另一类足以密集的复数矩阵操作为主的算法，包括信道估计和多输入多输出（ Multiple-Input Multiple-Output，MIMO）均衡等算法。这两类算法均需要DSP处理器提供较高的浮点乘加运算的计算性能。第一类算法主要是进行乘加运算（a*b+c），第二类算法主要进行大量的复数矩阵乘和矩阵求逆等运算，而在这些运算中都存在密集的乘后加运算（a*c+c*d）浮点乘累加器（Floating-point　Multiply ACcumulate．FMAC）已经成为提高并行计算以减少计算延时的有效方法，其运算能力已经成为衡量数字信号处理器DSP性能的一个重要特征。

　　浮点乘加结构已被研究多年，IBM学者Montoye和Hokenek于1990年最先提出了融合乘加的概念，即将乘法和加法融合成一条指令执行，并将加法操作融合在乘法的部分积压缩阵列中，从而减少硬件开销和延时；这种乘加结构的主要缺点是求和尾数长且结果尾数舍入延时长。Lang等于2004年提出了低延时融合乘加结构，这种结构采用前导零预测（ Leading Zero Anticipation，LZA），将尾数舍入和加法合并，并在尾数加法之前进行规格化移位。目前大多数处理器中的浮点乘加设计实现均采用这种技术，为进一步提高浮点融合乘加结构的并行度以提升浮点乘加器的性能，Lang等于2005年设计了双通路浮点融合乘加结构，该乘加结构主要优点是延时更低、处理性能得到进一步提高；但该乘加结构逻辑设计复杂，硬件资源消耗大。国防科技大学研制的vr-XDSP中设计了多功能快速浮点融合乘加运算单元，但该设计硬件资源消耗太多，功耗过大。

　　本文基于高性能计算的应用需求，以M型数字信号处理器（ M-DSP）为研究背景，深入研究FMAC的各功能模块和流水线结构，对已有浮点融合乘加结构p1的关键模块和算法进行了研究与优化，设计了6级流水线结构的FMAC单元，可支持双精度和单精度浮点乘法、乘累加、乘累减、单精度点积和复数运算。对所设计的FMAC单元的寄存器传送语言（Register Transfer Language，RTL）代码实现迸行了仿真测试，并基于45 nm工艺采用Synopsys公司的DC（ Design Compiler）对硬件实现进行了综合，运行频率可达1 GHz。

基于M-DSP的浮点乘累加器设计

累加器

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

爱华AIWA HS-J202维修手册
2025-12-22 34次下载

下载
PC5502负载均流控制电路数据手册
2025-12-19 22次下载

下载
飞利浦D8714收录机说明书
2025-12-02 12次下载

下载
⼯业电源&模块电源产品⼿册
2025-11-28 6次下载

下载
H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
2025-12-10 6次下载

下载
UWB653Pro USB口测距通信定位模块规格书
2025-12-16 5次下载

下载

基于M-DSP的浮点乘累加器设计

TMS320C6742定点和浮点DSP数据表

TMS320C6746定点和浮点DSP数据表

浮点运算单元FPU能给电机控制带来什么？

#STC89C51# #STC89C52# #AT89S51# #AT89C52#--8051内核单片机原理及汇编(三)：CPU

51单片机中累加器A与ACC的区别

MCS-51单片机指令系统总结（自学笔记）

MCU进行双精度与单精度浮点数运算的误差比较测试

80c51单片机指令大全

DSP和普通的MCU或者SOC区别小结

基于DSP控制器的油气安全智能巡检机器人

LMS自适应滤波器的MATLAB仿真和DSP实现

基于FPGA和DSP的机载图形显示系统

基于DSP的高压训线机器人数字化控制器

浮点DSP运算效率不高

基于双DSP结构的有源滤波器检测及控制系统

一个自动驾驶出租车动态合乘的仿真系统

如何使用STM32F30x 内部的DSP 进行浮点快速傅立叶变换资料下载

BP神经网络图像压缩算法乘累加单元的FPGA设计论文详细说明

Arduino的累加器实验程序和工程文件免费下载

32位数字相位累加器的程序和工程文件免费下载

使用STM32微控制器上的浮点单元实现性能演示

51单片机的汇编指令合集详解

TMS320C672x系列DSP的EMIF接口研究与应用资料说明

51单片机的数据传递类和控制转移类指令的详细资料说明

C8051F系列51单片机的指令详解

TMS320C672x系列DSP的EMIF扩展存储器的研究与应用的分析

MC9S12DG256微控制器的详细中文资料介绍

DSP设计与应用教程之TMS320C54XDSP寻址方式的详细资料说明

DSP教程之DSP数值运算基础总结的详细资料说明

单片机汇编指令大全的资料免费下载

17个DSP的简答题和答案资料大全免费下载

德州仪器DSP音频系统如何改善驾乘体验

相位累加器的实现原理

三菱PLC常用指令说明

三菱plc累加指令怎么用

tonr是什么意思

西门子博途STL指令L：加载

SIMATIC S7-1500 PLC循环右移指令(ROR)

SIMATIC S7-1500 PLC右移指令(SHR)简述

SIMATIC S7-1500 PLC左移指令(SHL)简述

数字设计笔试Verilog手撕代码—累加器

FPGA运算单元对高算力浮点应用

FPGA运算单元对高算力浮点应用

如何使用功率累加器进行实时功率测量

如何基于DDFS实现精确正弦波发生器的设计

DDS正弦波音调发生器的设计

数字音频32位DSP CS485xx DSP系列的主要特点及应用

超低功耗浮点DSP TMS320C6745/47的特点性能及应用范围

基于相位累加器的任意分频原理解析

FPGA中如何充分利用DSP资源，DSP48E1内部详细资源介绍

基于32位浮点DSP芯片TMS320C6713实现语音编解码系统的设计

基于Adaboost算法结合Virtex5平台如何提升FPGA器件的性能

芯福公司即将更新一代的SOS热成像传感器

震惊！FPGA运算单元可支持高算力浮点

定点DSP C55x音频专用处理器嵌入式教学

基于TI TMS320C6748定点/浮点DSP C674x处理器

圆的两种定义

寄存器、累加器、暂存器有什么区别

相位累加器原理及累加器代码

简析DSP的工作原理

区块链RSA累加器批处理技术解析

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

⼯业电源&模块电源产品⼿册

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

UWB653Pro USB口测距通信定位模块规格书