TMS320C6000 DSP的编程实现浅谈TMS320C6000编程

杨桂花 2018-09-07 4787

编程实验

72人已加入

描述

　　本文只要是关于TMS320C6000的相关介绍，并着重对TMS320C6000和DSP的编程实现进行了详尽的阐述。

　　DSP

　　现代社会对数据通信需求正向多样化、个人化方向发展。而无线数据通信作为向社会公众迅速、准确、安全、灵活、高效地提供数据交流的有力手段，其市场需求也日益迫切。正是在这种情况下，3G、4G通信才会不断地被推出，但是无论是3G还是4G，未来通信都将离不开DSP技术（数字信号处理器），DSP作为一种功能强大的特种微处理器，主要应用在数据、语音、视像信号的高速数学运算和实时处理方面，可以说DSP将在未来通信领域中起着举足轻重的作用。

　　为了确保未来的通信能在各种环境下自由高效地工作，这就要求组成未来通信的DSP要具有非常高的处理信号的运算速度，才能实现各种繁杂的计算、解压缩和编译码。而目前DSP按照功能的侧重点不一样，可以分为定点DSP和浮点DSP，定点DSP以成本低见长，浮点DSP以速度快见长。如果单一地使用一种类型的DSP，未来通信的潜能就不能得到最大程度的发挥。为了能将定点与浮点的优势集于一身，突破DSP技术上的瓶颈，人们又推出了一种高级多重处理结构--VLIW结构，该结构可以在不提高时钟速度的情况下，实现很强的数字信号处理能力，而且它能同时具备定点DSP和浮点DSP所有的优点。为了能推出一系列更高档的新技术平台，人们又开始注重DSP的内核技术的开发，因为DSP的内核就相当于计算机的CPU一样，被誉为DSP的心脏，大量的算法和操作都得通过它来完成，因此该内核结构的质量如何，将会直接影响整个DSP芯片的性能、功耗和成本。

　　考虑到未来无线访问Internet因特网和开展多媒体业务的需要，现在美国的Sun公司又开始准备准将该公司的拳头产品--PersonalJava语言嵌入到DSP中，以便能进一步提高DSP在处理信号方面的自动化程度和智能化程度。当然，在以前DSP中也潜入了其他软件语言，例如高级C语言，但这种语言在处理网络资源以及多媒体信息方面无能为力；而PersonalJava是一种适合个人网络连接和应用的Java环境，基于该环境的个人通信系统可以从网络和Internet网上下载数据和图像。此外，人们还在研究开发符合MPEG-4无线解压缩标准DSP，该压缩标准将为未来通信传输各种多媒体信息提供了依据。

　　作为一个案例研究，我们来考虑数字领域里最通常的功能：滤波。简单地说，滤波就是对信号进行处理，以改善其特性。例如，滤波可以从信号里清除噪声或静电干扰，从而改善其信噪比。为什么要用微处理器，而不是模拟器件来对信号做滤波呢？我们来看看其优越性：模拟滤波器（或者更一般地说，模拟电路）的性能要取决于温度等环境因素。而数字滤波器则基本上不受环境的影响。数字滤波易于在非常小的宽容度内进行复制，因为其性能并不取决于性能已偏离正常值的器件的组合。一个模拟滤波器一旦制造出来，其特性（例如通带频率范围）是不容易改变的。使用微处理器来实现数字滤波器，就可以通过对其重新编程来改变滤波的特性。

　　TMS320C6000

　　ＴＩ高速信号处理器ＴＭＳ３２０Ｃ５Ｘ和ＴＭＳ３２０Ｃ６Ｘ需要从外部的存储器（ＲＯＭ或ＦＬＡＳＨ）中引导应用程序这是开发中的重点和难点之一，关系到系统的可靠性和处理速度。以ＴＭＳ３２０Ｃ６０００ＤＳＰ为例，介绍了应用程序的三种引导方式；以实际工程为背景详细叙述了从ＲＯＭ中引导程序的实现方法，并钟对其中重要的命令文件和用户引导程序，给出了相应的示例文件和程序。关键词：TMS320C6000 DSP CMD 引导１ＴＭＳ３２０Ｃ６０００ＤＳＰ硬件结构概述ＴＭＳ３２０Ｃ６０００是ＴＩ公司生产的ＴＭＳ３２０系列产品中新一代高性能的ＤＳＰ芯片，适用于高速数字信号处理。ＴＭＳ３２０Ｃ６０００主要由三个部分组成：ＣＰＵ内核、外设和存储器。ＣＰＵ中８个功能单元可以并行工作，这些功能单元被分成类似的两组，每组由４个基本功能单元组成。ＣＰＵ有两组寄存器，每组寄存器由１６个３２位寄存器组成。由于在运行期间不做硬件数据相关性检查，所以程序运行时可以同时执行８条指令，极大地提高了芯片处理速度，这使得该系列的芯片在电子测量、测控、图像、雷达、声纳和软件无线电等领域得到了广泛的应用。

　　２加电后ＤＳＰ的运行过程系统加电后，ＲＥＳＥＴ信号为低，芯片复位。在ＲＥＳＥＴ信号上升沿处，锁存ＢＯＯＴＭＯＤＥ［４：０］信号，借以决定芯片的存储器映射方式、地址０处的存储器类型以及复位后芯片的自举模式，复位结束后，芯片从存储器的０地址开始执行指令。ＴＭＳ３２０Ｃ６０００器件可以设置成三种自举方式，其加载过程分别叙述如下：（１）不加载。ＣＰＵ直接从存储器的０地址处开始执行指令。如果系统中使用的是ＳＤＲＡＭ，那么ＣＰＵ会先挂起，直到ＳＤＲＡＭ的初始化完成。ＴＭＳ３２０Ｃ６２１Ｘ／Ｃ６７１Ｘ不具有这类方式。（２）ＲＯＭ加载。位于外部空间的ＲＯＭ中的程序首先通过ＤＭＡ／ＥＤＭＡ搬入地址０处。尽管加载过程是在芯片外部被复位信号释放以后才开始的，但是当芯片仍处于内部复位保持时，就开始了上述的传输过程了。用户可以指定外部ＲＯＭ的存储宽度，ＥＭＩＦ会自动将相邻的８ｂｉｔ／１６ｂｉｔ数据合并成３２ｂｉｔ。ＲＯＭ中的程序必须以ｌｉｔｔｌｅｅｎｄｉａｎ的格式存储。

　　TMS320C6000 DSP的编程实现

　　开发ＤＳＰ系统应用板，最终要脱离仿真器而独立运行，这时就需要一个能在断电后保存程序及初始化数据的存储器。系统上电时，由引导程序将ＤＳＰ的应用程序从该存储器引导到ＤＳＰ应用板上的高速存储器（如内部ＳＲＡＭ，ＳＤＲＡＭ等）中。由于ＦＬＡＳＨ具有电信号删除功能？且删除速度快，集成度高，因而已成为此种存储器的首选。

　　将用户程序代码写入ＦＬＡＳＨ的方法有两种：第一种是用专门的ＦＬＡＳＨ编程器实现，第二种是通过系统微处理器与ＦＬＡＳＨ的接口来实现。第一种方法的主要优点是使用方便可靠，但要求ＦＬＡＳＨ只能是双列直插等一些可插拔的封装形式，由于芯片制造工艺的提高，芯片的集成度越来越高，ＦＬＡＳＨ正向小型化、贴片式发展，从而使表面贴装或ＰＬＣＣ封装的ＦＬＡＳＨ难以利用编程器编程。第二种方法克服了第一种方法的缺点，且使用灵活，因而在ＤＳＰ系统中的应用日益广泛。

　　由于ＦＬＡＳＨ的存取速度较慢，写入ＦＬＡＳＨ的程序将在系统上电时被ＤＳＰ装载到快速的存储器中运行，这个过程称为ｂｏｏｔｌｏａｄｅｒ。不同的ＤＳＰ有不同的引导方式，本文将以ＴＭＳ３２０Ｃ６７１３为例来介绍ＴＭＳ３２０Ｃ６０００系列的ｂｏｏｔｌｏａｄｅｒ方式。

　　１　ＦＬＡＳＨ的工作方式及在系统编程

　　目前，市场上的ＦＬＡＳＨ型号很多，但工作方式大体相同，下面以ＡＭ２９ＬＶ１６０Ｄ为例进行介绍。

　　１．１ＡＭ２９ＬＶ１６０ＤＦＬＡＳＨ存储器简介

　　ＡＭ２９ＬＶ１６０Ｄ是ＡＭＤ公司生产的２Ｍ×８ｂｉｔ／１Ｍ×１６ｂｉｔＦＬＡＳＨ存储器，它的数据宽度为８位、１６位可选，采用３．３Ｖ供电，完全兼容ＪＥＤＥＣ标准，并支持在系统编程，用户只需向其内部的命令寄存器写入命令序列即可实现部分擦除、全部擦除、数据写入等功能；同时可提供硬件和软件方法来检查ＦＬＡＳＨ的操作执行情况。

　　图1

　　１．２编程方法

　　对ＦＬＡＳＨ的在系统编程就是通过一定的编程命令序列来控制ＦＬＡＳＨ的工作方式，这些命令序列是一些特定字符的组合，只要向ＦＬＡＳＨ中的特定寄存器以特定的顺序输入这些字符即可进入相应的编程模式。ＡＭ２９ＬＶ１６０Ｄ中的主要命令序列和写入地址如图１所示。具体说明如下：

　　●复位命令序列：对ＦＬＡＳＨ中任一地址写入“Ｆ０”，即可实现复位。

　　● 自动选择模式：此模式主要用于编程器编程时，由编程器根据从数据线ＤＱ７～ＤＱ０读出的识别码自动配置编程逻辑，当然也可以通过命令序列在在系统情况下将自动选择码读出。

　　●编程命令序列：程序可以以字节方式或字方式写入，这主要根据ＦＬＡＳＨ外部引脚ＢＹＴＥ的状态而定。

　　●芯片擦除命令序列：ＦＬＡＳＨ编程时应先执行擦除命令，这是因为编程指令只能将数据由１变为０，反之则不行。

　　● 扇区擦除命令序列：为了编程方便及保护有用数据，数据擦除可以只擦除某些无用的扇区。

　　● 擦除暂停和恢复命令序列：这个命令序列只在进行扇区擦除时有效，它允许编程者中断一个扇区的擦除操作，接着从没有被擦除的扇区读出或写入数据。

　　●写入命令：也分为字节模式和字模式，分别对应ＦＬＡＳＨ的８位和１６位工作方式，具体为哪种模式，可由ＦＬＡＳＨ的ＢＹＴＥ脚的输入来决定，低电平为字节模式，高电平为字模式。

　　在对ＦＬＡＳＨ进行编程时，ＦＬＡＳＨ提供硬件和软件机制来获得ＦＬＡＳＨ的状态，以确定数据写入或擦除操作是否完成。硬件方法主要是利用ＦＬＡＳＨ的外部引脚ＲＹ／ＢＹ的输出信号在命令序列的最后一个写脉冲（ＷＥ）的上升沿之后有效。当该输出为低电平时，表示ＦＬＡＳＨ正在编程或擦除中，而当该输出脚为高电平时，即表示编程或擦除已完成。将此引脚与ＴＭＳ３２０Ｃ６７１ｘ系列ＤＳＰ的ＡＲＤＹ引脚相连，即可实现硬件的自动编程或擦除的完成判断。Ｃ６０００系列ＤＳＰ与ＦＬＡＳＨ的连线图如图２所示。

　　软件方法是利用从ＦＬＡＳＨ数据线读取的数据来判断ＦＬＡＳＨ的状态，读取数据中的主要判断位为ＤＱ２、ＤＱ３、ＤＱ５、ＤＱ６和ＤＱ７，它们之间的相互组合提供了几种软件判断状态的方法，应用较多且较为简便的方法是在命令序列写入后，如果写入的是编程命令，则选择一个地址，并循环读取这个地址的数据。若装置仍处于编程状态之中，ＤＱ７输出为写入数据的补码，而在编程完成后，ＤＱ７输出的是所选地址上的正确数据。如果写入的是擦除命令，那么？当装置处于擦除状态时，则ＤＱ７输出为０，若擦除完成或擦除被中断？ＤＱ７输出为１。选择地址时应注意：若地址所在区域属于ＦＬＡＳＨ中的保护区域，则ＤＱ７输出的ＦＬＡＳＨ状态信息有效，有效时间只能持续大约１μｓ，然后输出正确数据。而擦除命令擦除的范围如果包括ＦＬＡＳＨ中的保护区域，那么命令将被忽略，此时ＤＱ７输出状态信息有效，持续时间大约１００μｓ。对ＦＬＡＳＨ的操作有时会出错，出错时，ＦＬＡＳＨ将处于不正常状态，ＤＱ７可能永远也不会输出地址上的正确数据，此时就需读取ＤＱ５的输出信息，若为１则表示操作失败。其软件流程图如图３所示。

　　对ＦＬＡＳＨ的编程既可以用汇编语言，也可以用Ｃ语言，以下给出部分Ｃ代码。该程序代码可采用ＴＩ公司专门用于ＴＩ公司系列ＤＳＰ编程的ＣｏｄｅＣｏｍ-ｐｏｓｅｒＳｔｕｄｉｏ编程工具进行编写。

　　ｖｏｉｄｅｒａｓｅ_ｆｌａｓｈ（ｓｈｏｒｔ＊ｆｌａｓｈ_ｐｔｒ）

　　{

　　ｓｈｏｒｔ＊ｃｔｒｌ_ａｄｄｒ１＝（ｓｈｏｒｔ＊）（（ｉｎｔ）ｆｌａｓｈ_ｐｔｒ＋（０ｘ５５５＜＜２））;

　　／＊此处０ｘ５５５地址左移两位，按１６位存储器来看，本来只需左移一位，但在计算式中？地址ｆｌａｓｈ_ｐｔｒ是先转换成ｉｎｔ型再计算的，而要写入命令的地址０ｘ５５５为１６位地址，所以需乘２，因此应当再左移一位＊／

　　ｓｈｏｒｔ＊ｃｔｒｌ_ａｄｄｒ２＝（ｓｈｏｒｔ＊）（（ｉｎｔ）ｆｌａｓｈ_ｐｔｒ＋（０ｘ２ａａ＜＜２））；？

　　＊ｃｔｒｌ_ ａｄｄｒ１＝０ｘ００ａａ；

　　＊ｃｔｒｌ_ａｄｄｒ２＝０ｘ００５５；

　　＊ｃｔｒｌ_ａｄｄｒ１＝０ｘ００８０；

　　＊ｃｔｒｌ_ａｄｄｒ１＝０ｘ００ａａ；

　　＊ｃｔｒｌ_ａｄｄｒ２＝０ｘ００５５；

　　＊ｃｔｒｌ_ａｄｄｒ１＝０ｘ００１０；

　　}

　　ｖｏｉｄｐｒｏｇｒａｍ_ｆｌａｓｈ（ｓｈｏｒｔ＊ｓｏｕｒｃｅ_ｐｔｒ？ｓｈｏｒｔ＊ｆｌａｓｈｐｔｒ，ｓｈｏｒｔｌｅｎｇｔｈ）

　　{

　　ｓｈｏｒｔｉ？

　　ｓｈｏｒｔ＊ｃｔｒｌ_ａｄｄｒ１＝（ｓｈｏｒｔ＊）（（ｉｎｔ）ｆｌａｓｈ_ｐｔｒ＋（０ｘ５５５＜＜２））;？？

　　ｓｈｏｒｔ＊ｃｔｒｌ_ａｄｄｒ２＝（ｓｈｏｒｔ＊）（（ｉｎｔ）ｆｌａｓｈ_ｐｔｒ＋０ｘ２ａａ＜＜２））;？

　　ｆｏｒ（ｉ＝０;ｉ＜ｌｅｎｇｔｈ;ｉ＋＋）

　　{

　　＊ｃｔｒｌ_ａｄｄｒ１＝０ｘ００ａａ;

　　＊ｃｔｒｌ_ａｄｄｒ２＝０ｘ００５５;

　　＊ｃｔｒｌ_ａｄｄｒ１＝０ｘ００ａ０;

　　＊ｆｌａｓｈ_ｐｔｒ＋＋＝＊ｓｏｕｒｃｅ_ｐｔｒ？

　　}

　　在上面的程序中，对ＦＬＡＳＨ的命令序列的写入地址有一个左移指令，即若应写入命令的寄存器地址为０ｘ５５５，实际编程时，应先对０ｘ５５５左移若干位，然后再对得到的地址写入命令。这是因为，ＴＭＳ３２０Ｃ６０００系列ＤＳＰ为３２位ＤＳＰ，它的外部地址总线引脚的最低位（ＬＳＢ）为ＥＡ２，即输出地址的最低位为实际地址的第２位，而不会输出第１位和第０位，但实际外接的ＦＬＡＳＨ可以是８位、１６位、３２位不等。如果连接非３２位存储器，在读数据时？ＤＳＰ的外部存储器接口（ＥＭＩＦ）会自动将实际地址左移若干位，以使外部地址总线引脚的最低位ＥＡ２根据ＦＬＡＳＨ位数的不同输出实际地址的第０位或第１位，然后再将几次读入的数据合成一个３２位的值（外接ＦＬＡＳＨ的位数可以在ＥＭＩＦ寄存器中设置），而在写数据时，就需要编程者手动进行移位，具体方法是？外接８位存储器时左移２位，外接１６位存储器时左移１位。

　　２　用ＦＬＡＳＨ实现ＤＳＰ的程序自引导

　　ＴＭＳ３２０Ｃ６０００系列ＤＳＰ包括多个型号，各个型号的程序自引导方法一致，下面以ＴＭＳ３２０Ｃ６７１３为例来介绍程序自引导的实现过程。

　　２．１ＴＭＳ３２０Ｃ６７１３ＤＳＰ简介

　　ＴＭＳ３２０Ｃ６７１３是ＴＩ公司推出的ＴＭＳ３２０Ｃ６７ｘｘ系列浮点ＤＳＰ中最新的一种芯片。ＴＭＳ３２０Ｃ６７１３每周期可以执行８条３２位指令；支持３２／６４位数据；具有最高２２５ＭＨｚ、４．４ｎｓ指令周期的运行速度和１８００ＭＩＰＳ或１３５０ＭＦＬＯＰＳ的处理能力；同时是有强大的外设支持能力；外部存储器接口（ＥＭＩＦ）可以很方便地和ＳＤＲＡＭ、ＳＢＳＲＡＭ、ＦＬＡＳＨ、ＳＲＡＭ等同步和异步存储器相连，１６位ＨＰＩ接口可以和各种处理器？如ＰＣ、ＰＯＷＥＲＰＣ等？接口；另外还有优化的多通道缓存串口和多通道音频串口（仅ＴＭＳ３２０Ｃ６７１３），这些外部接口使设计人员可以很容易实现自己的应用系统。

　　２．２ＴＭＳ３２０Ｃ６７１３程序自引导功能的实现

　　断电时用慢速ＲＯＭ或ＦＬＡＳＨ存储程序和初始化数据，上电后引导到内部或外部快速ＲＡＭ中运行是现在普遍采用的一种设计ＤＳＰ电路板的方法，该方法可靠、方便、灵活且成本较低。但对于不同的ＤＳＰ有不同的程序自引导方法。本文只讨论ＴＭＳ３２０Ｃ６０００系列ＤＳＰ的引导方法。

　　和以往ＴＩ公司的ＤＳＰ（如３ｘ、４ｘ）采用引导表由固化在ＤＳＰ内部的引导程序实现程序的自引导不同，ＴＭＳ３２０Ｃ６０００系列ＤＳＰ采用的是一种新的引导方法，对于ＴＭＳ３２０Ｃ６７１３，上电后，若选择从ＥＭＩＦ引导程序，则ＤＳＰ自动将位于地址空间ＣＥ１（０ｘ９０００００００～０ｘ９ＦＦＦＦＦＦＦ）开头的１ｋＢ代码传输到地址空间０处。它的数据传输采用默认时序，用户可以选择外部程序存储器的宽度（８位／１６位／３２位），然后由ＥＭＩＦ自动将几次读入的数据合成３２位数据。传输由ＤＳＰ中的ＥＤＭＡ通道以单帧的形式自动进行，传输完成后，程序从地址０处开始运行。因此，要在ＴＭＳ３２０Ｃ６７１ｘ中实现基于ＦＬＡＳＨ的自引导功能，必须将ＦＬＡＳＨ配置在ＤＳＰ的ＣＥ１地址空间中。

　　以上工作均由ＤＳＰ自动完成。很明显，自动传输的代码并不能满足绝大多数编程者对代码长度的要求，因此可在这段代码中加入数据传输功能，从而将实际工作中远大于１ｋＢ的代码由ＦＬＡＳＨ中读入到用户指定的存储空间，然后再将程序跳到实际有用的代码处运行。对ＦＬＡＳＨ编程并实现程序自引导的具体过程如下：

　　（１）对ＤＳＰ正常运行程序的处理

　　ＣｏｄｅＣｏｍｐｏｓｅｒＳｔｕｄｉｏ（ＣＣＳ）是ＴＩ公司开发的用于ＤＳＰ产品的软件开发工具。由ＣＣＳ得到的代码为目标文件格式（ＣＯＦＦ），这种格式文件不能直接写入ＦＬＡＳＨ，而要先用其它语言（如Ｃ）编写文件，然后由转换工具进行转化。

　　在ＣＯＦＦ格式下，程序被分成很多段（包括程序段、初始化数据段、未初始化数据段、自定义段等），每段都占据连续的存储空间，段与段之间相互独立。另外，在ＣＯＦＦ文件中，除了段内的用户程序和数据外，还包含一些额外的信息，其中有ＣＯＦＦ文件的版本、段的数量、段的长度和起始地址等，分析清楚这些信息，就可以编写自己的文件转换工具了。具体方法是：读入ＣＯＦＦ文件，根据格式分析该文件的内容，再把用户程序和数据部分提取出来，仍分成一个个段，并在每个段前加入起始位置和段长度信息，同时在最后一个段的末尾加上结束标志，最后写入一个新的文件。在此过程中，因为ＣＯＦＦ文件的字长为３２ｂｉｔ，而ＦＬＡＳＨ宽度可能为８ｂｉｔ或１６ｂｉｔ，因而要在两者之间进行手工转化。

　　（２）编写ｂｏｏｔ程序

　　ｂｏｏｔ程序的大小不能超过１ｋＢ，它主要完成以下几个功能：第一是配置ＤＳＰ的ＥＭＩＦ寄存器，然后从ＦＬＡＳＨ中把各个段中的程序和数据拷贝到用户指定的存储器物理地址中，同时跳到程序的入口点。在此应当注意：Ｃ程序的入口点并非ｍａｉｎ（），而是ｃ＿ｉｎｔ００，这是因为在调用ｍａｉｎ（）函数之前，系统必须先建立Ｃ语言的运行环境。如为系统堆栈定义．ｓｔａｃｋ段、建立初始化堆栈和祯指针、初始化全局和静态变量等。另外，由于ｂｏｏｔ程序本身也是ＣＯＦＦ文件格式，所以也需格式转换。

　　（３）编写ＦＬＡＳＨ烧写程序

　　ＦＬＡＳＨ的烧写程序可以根据前面的介绍来编写，但要注意，应将ｂｏｏｔ程序写入ＣＥ１空间开始的１ｋＢ中，而将ＤＳＰ正常工作程序写入１ｋＢ以后的地址空间中。

　　３　结束语

　　本文介绍了ＦＬＡＳＨ在系统编程和基于ＦＬＡＳＨ实现ＴＭＳ３２０Ｃ６７１３ＤＳＰ程序自引导的过程。实际上，ＴＭＳ３２０Ｃ６０００系列ＤＳＰ中其它类型（如Ｃ６２０１、Ｃ６７０１等）的ｂｏｏｔ也与本文所述相同，因此，完全可以相互借鉴。

　　结语

　　关于TMS320C6000的相关介绍就到这了，如有不足之处欢迎指正。

相关阅读推荐：DSP芯片主流厂商分析与常用芯片

相关阅读推荐：DSP芯片的特点与分类

打开APP阅读更多精彩内容

TMS320C6000 DSP的编程实现 浅谈TMS320C6000编程

描述

DSP

TMS320C6000

TMS320C6000 DSP的编程实现

结语

TMS320C6000 DSP的编程实现浅谈TMS320C6000编程

　　DSP

　　TMS320C6000

　　TMS320C6000 DSP的编程实现

　　结语