英创信息技术精简ISA总线Linux编程 – Part2简介

描述

精简ISA总线接口是一种8-bit宽度的双向并行扩展总线,其特点是地址数据分时复用8位总线,加上4条总线控制信号,即可实现对外部数据的快速读写。若再使能一条总线时钟信号(共13条信号),就可实现高达10MB/s以上的数据传输。精简ISA总线作为英创主板的特色功能之一,在ESM6802、ESM7000、ESM7100、ESM335x等多款型号中均有配置。

关于对精简ISA总线接口的应用编程的基本方法,请参考《精简ISA总线编程 – Part 1》。本文介绍由应用程序启动基于DMA的数据块读写,即MemCpy方式的DMA。采用DMA进行ISA总线数据传送的目的,是为了降低高速传送大量数据时的CPU开销。MemCpy方式的DMA是指软件线程启动DMA,然后该线程挂起等待DMA操作完成。在多线程环境中,其他线程即可在DMA执行过程中得以并行运行。

ISA总线信号定义如下:

信号及说明 PIN# 信号及说明
RESET_B,硬件复位 1 2 ISA_ADVn,地址锁存控制信号
ISA_AD0,地址数据总线,LSB 3 4 ISA_AD4,地址数据总线
ISA_AD1,地址数据总线 5 6 ISA_AD5,地址数据总线
ISA_AD2,地址数据总线 7 8 ISA_AD6,地址数据总线
ISA_AD3,地址数据总线 9 10 ISA_AD7,地址数据总线,MSB
MSLn,支持多模块挂接总线 11 12 ISA_WEn,数据写控制信号
GPIO9,可选作为IRQ 13 14 ISA_RDn,数据读控制信号
GPIO8,可选作为IRQ 15 16 ISA_CSn,片选控制信号
GPIO25,可选作为IRQ 17 18 VDD_5V0,+5V供电
GPIO24 / ISA_BCLK,同步时钟ISA_BCLK 19 20 GND,电源信号地

本文以下部分,将以ESM7000 Linux平台为例,介绍具体的编程方法。

DMA总线访问API

应用启动DMA数据传输,需要使用数据结构struct isa_transfer的传递参数和数据,structisa_transfer的结构定义如下:

  structisa_transfer
{
       void              *rx_buf;                /* != NULL: buffer for bus read */
       void              *tx_buf;                /* != NULL: buffer for bus write */
       unsigned     len;                      /* buffer length in byte */
       unsigned     offset;                  /* offset,port address on isa bus */
       unsigned     inc;                      /* = 0: fixed offset, = 1: offset+1 after r/w */
};

每一个总线周期的操作只能是读或写,因此在isa_transfer结构中只能有一个buffer指针不为NULL。以下是执行32字节数据块写的代码,写入地址为0x4040。顺序的数据可方便时序的观察。

  unsignedchargbuf[64 * 1024];
unsignedint i, value;
structisa_transfer      t;
unsignedchar   *pBuf8;
// write data block
memset(&t, 0, sizeof(structisa_transfer));
t.offset = 0x4040;
t.len = 32;            // max len<= 16KB = 16 * 1024
t.tx_buf = gbuf;
// fill data
value = 0x55;             // initialvalue
pBuf8 = (unsignedchar*)t.tx_buf;
for(i = 0; i
       *pBuf8 = (unsignedchar)(value + i);
       pBuf8++;
}
isa_write_buf(fd, &t);

注意offset必须是0x4000 – 0x40FF,驱动程序才会启动MemCpy方式的DMA传输。若从0x4040读入32字节数据,实现代码则为:

  unsignedchargbuf[64 * 1024];
structisa_transfer      t;
// read data block
memset(&t, 0, sizeof(structisa_transfer));
t.offset = 0x4040;
t.len = 32;                   // max len<= 16KB = 16 * 1024
t.rx_buf = gbuf;
isa_read_buf(fd, &t);

DMA传输总线时序说明

图1、图2分别为MemCpy方式DMA读总线时序概要、写总线时序概要。

嵌入式主板

图1 DMA读总线时序

嵌入式主板

图2 DMA写总线时序

从上面的时序可见,DMA也是16字节一组,连续4个总线周期组成,每组之间有一定间隔。DMA读操作的总线速率大约为11.8MB/s,DMA写操作的总线速率大约为11.2MB/s。

展开DMA写的总线时序可看到:

嵌入式主板

图3 DMA写总线时序—第1组起始部分

嵌入式主板

图4 DMA写总线时序—第1组结束部分

嵌入式主板

图5 DMA写总线时序—第2组起始部分

嵌入式主板

图6 DMA写总线时序—第2组结束部分

在每个总线周期中,地址递增4。这样当传输长度超过256字节时,ISA地址及会循环。这意味着当采用MemCpy方式DMA进行数据传输时,数据端口译码不能采用普通的组合电路地址译码方式,而必须采用BCLK+ ADV#的同步电路译码方式。具体方式就是每个周期的第一个BCLK下降沿锁存到有效ADV#,标志同步周期的开始,之后经过连续7个BCLK下降沿后同步周期结束。

DMA传输时的CPU负载率

与纯软件的同步总线周期传输相比,DMA传输最大的优点是有效降低了总线传输的CPU开销,使应用程序的其它线程能同步运行。基本的测试代码如下:

  #define MAX_DMA_LEN         (16*1024)
unsignedchar gbuf[64 * 1024];
unsignedint i, count = 1;
struct isa_transfer     t;
unsignedchar   *pBuf8;
longdouble a[4], b[4], loadavg;    //for CPU utilization calculation
FILE *fp;
constchar *bus_type_name[] = {"async-cpu","async-dma-mem","async-dma-ext", "sync-cpu","sync-dma-mem","sync-dma-ext"};
// fill data
pBuf8 = (unsignedchar*)gbuf;
for(i = 0; i < MAX_DMA_LEN; i++){
       *pBuf8 = (unsignedchar)(value + i);
       pBuf8++;
}
memset(&t, 0, sizeof(struct isa_transfer));
// get initial values for calculating CPU usage in %
fp = fopen("/proc/stat","r");
fscanf(fp,"%*s %Lf %Lf %Lf %Lf",&a[0],&a[1],&a[2],&a[3]);
fclose(fp);
// write data block loop
while(count) {
       i = (count < MAX_DMA_LEN)? count : MAX_DMA_LEN;
       t.offset = offset;
       t.len = i;
       t.tx_buf = gbuf;
       isa_write_buf(fd, &t);
       count -= i;
}
// get end values for calculating CPU usage in %
fp = fopen("/proc/stat","r");
fscanf(fp,"%*s %Lf %Lf %Lf %Lf",&b[0],&b[1],&b[2],&b[3]);
fclose(fp);
// calculate CPU usage in %
loadavg = ((b[0]+b[1]+b[2]) - (a[0]+a[1]+a[2])) / ((b[0]+b[1]+b[2]+b[3]) - (a[0]+a[1]+a[2]+a[3]));
loadavg *= 100;
i = (offset >> 12) & 0xf;
printf("%s bus write, CPU utilization is : %Lf%%\n",bus_type_name[i], loadavg);

使用100M数据长度来测试总的CPU负载率的情况如下:

模式 MemCpy DMA 纯软件操作
同步总线读 6.01% 50.3%
同步总线写 5.71% 50.0%

ESM7000使用的是具有双核CPU的iMX7D,总CPU负载率50%,表示某个CPU核的负载已经100%。DMA的使用对提高系统整体的性能是非常显著的。

进一步可测试应用层实际的传输速率如下:

模式 传输速率 CPU负载
MemCpy DMA同步总线读 8.67MB/s 6.01%
MemCpy DMA同步总线写 7.93MB/s 5.71%

若把每个周期传输的字节数从4个提升到8个,传输率则可有50%的提升。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分