如何提高微处理器分机监控电路系统的可靠性

描述

1.引言

嵌入式微处理器应用系统是一种面向应用、功能定制、资源受限、响应要求高、性能稳定、无自举开发能力,由硬件和软件两部分构成的专用计算机系统,其在日常生活中、工业生产中、国防领域中都得到了广泛的应用。但是嵌入式微处理器系统往往工作环境比较复杂,一般情况下都存在自然因素或人为因素产生的电磁干扰,各种干扰通过一定的途径进入系统或测量通道,对系统产生一定的干扰,而且随着系统软件规模的增加,系统运行不稳定的现象愈来愈严重,因此,可靠性已成为衡量嵌入式微处理器系统性能优劣的一个重要因素。

在某系统工程设计中,由于需要测量和监控的数据点数量众多,对此,我们大量采用了微处理器分机监控电路进行数据的采集和数据通信。本文主要对如何提高系统的可靠性进行了分析论证,并在此基础上阐述了提高各分机工作稳定性所采取的具体措施。

2.系统组成与工作要求

系统的监测点分散在直径约一千米的近似圆形范围内,呈放射状。监测点总共划分为16组,每组378个子节点,总数量有六千多个,主站监控通过通信网络对所有子节点进行统一管理,系统结构见图1.

嵌入式

每个子节点需要进行7路模拟电压的采集计算、1路模拟电压控制输出、3路开关量的控制。主站监控每3秒完成一次对所有子节点的巡检,收集所有的测量数据和发送控制参量。

由于监测点存在强微波能量辐射,并且工作区域位于我国西北地区,昼夜环境温差较大。同时,系统要求除去每月一天的停机维护外,其余时间均正常加电工作,子节点监控电路允许有3%的失效率。

这些外在的环境因素和工作时长对系统的工作稳定性提出了非常严格的要求,这也使得系统的关键部分-微处理器电路的可靠性面临着极为严峻的考验。因此,在系统的初期研制开发的过程中,必须重视可靠性分析和设计,否则整个系统将无法正常工作,不能实现目标设计功能。

3.系统可靠性分析与设计

从功能上划分来看,系统由子节点分机监控电路、通信网络、电源供给网络、主站监控四部分组成,从对系统任务功能的影响来看,它们均与系统功能直接相关。它们的任一部分失效,就会导致整个系统失效,因此称它们为系统的主要分机。针对系统工作的地理位置、外在电磁环境特点、目前现有商业技术的成熟度,以及系统的总体性能要求,系统的可靠性模型建立为串联模型,可靠性指标的分配采用综合因子评定法确定加权因子,为使系统分配的可靠性指标合理可行,我们主要考虑了各分机系统的重要因子、复杂因子、维修因子、技术成熟因子、环境因子、元器件质量因子、软件应用程度因子等因素。根据这七个主要影响可靠性的因素,利用可靠性分析软件IETM反复进行MTBF参数的计算与分配,最终获得了一个最佳平衡点数据。

系统的靠性设计遵循以下设计准则:

a.简化设计:尽量简化系统配置,减少硬件和软件的数量和规模。

b.继承性和优化设计:最大限度并合理地采用已经验证或成熟的硬件、软件技术;支持对提高产品可靠性有利的技术进步,但新技术必须经过验证。

c.元器件选用:选用满足工程质量等级的元器件,努力减少器件型号、规格和生产厂,进行老炼筛选。

d.冗余和容错设计:采用充分、合理的硬件和软件的冗余和容错设计;尽力消除单点故障;对技术上确难消除的单点故障必须通过设计降低其失效率,使之达到可接受的程度。

e.耐环境设计:实施硬件的环境影响分析和环境防护设计。

f.余量和降额设计:按标准和规范的要求开展非电子产品的安全裕度设计,元器件降额使用,电路容差的分析和设计。

g.采用有效的设计技术和方法,提高软件程序的健壮性,选择易于编写、校正和修改的程序结构,采用模块化程序设计方法。

4.系统的硬件/软件抗干扰设计

作为系统的关键主体部分-微处理器电路,其抗干扰设计是一项综合性设计,采取硬件措施虽然可有效提高监控控制系统的抗干扰能力,但过多的硬件本身就降低了系统的可靠性,尤其是有源器件。因而电路的设计要“软”、“硬”兼施,提高系统的防护和容错能力,从而提高分机监控系统的可靠性。

4.1 硬件方面

按照设计要求和目的,主要从以下几个方面来提高系统硬件的可靠性。

1)元器件的选用上:一是根据整机的具体布局、及整机在最高温度下元器件工作的正常性,来考虑选用合适的元器件。

二是系统一定要采用质量高、性能稳定、应用成熟的元器件。三是结合系统的使用年限、所处位置、频率范围、所处的干扰脉冲强弱等因素等,选择在性能、可靠性较高,具有特殊要求的元器件。四是在选择CPU和外围器件尤其是速度较慢的外设芯片时,要考虑两者的速度匹配问题及元器件的品级(如民用级、工业级还是军品级),在软件编程时应特别注意速度匹配问题。

2)印制板设计上:从减小辐射干扰的角度出发,选用多层板。内层分别做电源层、接地层。对信号形成均匀的接地面,加大信号线和接地面间的分布电容,抑制其向空间辐射的内力,供电层和地层最好紧邻,以增大电源与地之间的分布电容。电源线、地线、印制板走线对高频信号应保持低阻抗。

3 )设计良好的接地系统。接地不良时,将形成明显的干扰。防止地线干扰主要三种形式:一是坚持一点接和多点接地的应用原则。在低频电路中,电线和元器件之间的电感干扰并不多,多采用一点接地;在高频电路中,布线和元器间的电感干扰以及分布电容会造成各地线之间的偶合,应采用多点接地。二是采用数字地与模拟地的连接原则。芯片数字逻辑接地端和模拟信号的接地端应分别接地,在一个芯片上有两种不同的接地端也应分别接地,然后汇总。

4)电源的抗干扰措施。电源在向系统供电时,也将其噪声耦合到系统电源上。

为了抑制电网电压的波动,可在交流电源输入端加上电源滤波器,让电源频率附近的频率成分通过而使高于此频率的成分很大衰减,防止由于干扰所产生的电容效应进入到系统内部。二是系统内部通常需要不同的几种直流电源,为减少公共阻抗的相互偶合和单个电路故障的有效保护,应采用高质量的集成稳压电路进行单独供电。此外,还应当采用直流开关电流,保证独立电压输出,对直流电流起着较好的初、次级隔离作用。

4.2 软件方面

1)开机自检技术

系统在加电在开启后,首先应对系统内部的软件逐一的进行状态检测,如内部RAM,SFR及EPROM,I/O芯片等进行故障检查和诊断,并能给出故障部位,当各项检查正常后,程序才可以继续执行。设置自检程序是提高测控系统可靠性的有效方法之一。

2)指令冗余技术

当系统受到干扰出现错误时,程序会在地址空间内出错,破坏程序计数器PC的状态。程序若“跑飞”到三字节指令,出错率将会更大。所以,应采用指令冗余技术,即在系统内的关键地方人为插入一些单字节的空操作指令,通常是在双字节指令和三字节指令后插入两个字节上的NOP空指令。插入后,即使“乱飞”程序飞到操作数上,由于空操作指令NOP的存在,也根本地避免了后面的指令被当作操作数执行,程序将会自动地纳入到正轨上来。

此外,对程序流向起重要作用的指令如RET,RETI,LCALL,LJMP,JC等,在其之前插入两条NOP指令也可将出错程序纳入正轨。

3)软件陷阱技术

如果“跑飞”程序进入到非程序区,那么,上文所述的指令冗余技术便起不到任何作用,此时,可通过设置软件陷阱来拦截“跑飞”程序并将其引向指定位置,再进行处理。软件陷阱通常装在下面四种地方:一是未使用的中断向量区;二是未使用的大片ROM区;三是表格,为了不破坏其连续性,一般把软件陷阱安排在表格的最后;四是程序区,软件陷阱一般安排在程序的断点处,如LJMP,RET等。

4)软件“看门狗”技术

如果失控的程序进行死循环,通常使用“看门狗”技术使其脱离死循环。系统通过不间接地检测程序循环运行时间,若发现程序循环运行超过最大的循环运行时间,则会认定系统陷入“死循环”.“看门狗”技术可使程序返回到程序的入口地址,使系统重新纳入到正常运行轨道,它可由软件实现,也可由硬件实现。任务切分的时候应充分考虑到任务的执行最大时间应该小于看门狗结束时间。

5)采用μC/OS-II嵌入式操作系统

μC/OS-II自1992年发布以来,已经被移植到几乎所有嵌入式应用类CPU上,该操作系统是经过很多实际应用验证并改进的,其内核稳定可靠,因此,只要分机处理器硬件不出现故障,则操作系统程序就可以保证正常运行,其它子任务程序在操作系统的统一调度下,也可以实现稳定的运行。因此相比没有操作系统的单循环式的前后台程序,采用了嵌入式操作系统的分机监控,其软件程序的稳定性有着质的改变。

5.系统通信方式与构成

通信网络负责子节点与主站监控之间的数据交互,如果通信网络不能正常的工作,即使分机监控可靠性再高,系统也无法实现既定功能。面对数量众多的测量节点,如果采用常规的点对点式通信进行数据传输,将导致大量的硬件接口在主站监控点集中汇总,其规模是非常庞大且复杂的,这将大大降低系统工作可靠性,也增加了后续维护工作的难度。针对分机监控系统特点,这里采用现场总线(CAN)通信网络。其特点是可以在一对传输线上挂接多个通信节点,可大大减少硬件接口的数量,降低通信网络的硬件结构复杂程度是本系统的最佳应用方案,见图2.

嵌入式

主站与各节点之间通过31个以太网-CAN转换模块进行数据通信,每个模块有2组CAN总线,可挂接200个分机监控子节点。为了保证传输数据不会被干扰,信号传输介质全部采用光纤,子节点以及以太网-CAN转换模块首先通过电光转换器件把电信号转为光信号,再通过光缆进行长距离传输。由于光纤采用非金属介质材料,它不会与其它信号产生感应耦合,使光纤对外部电磁干扰有完全的免疫力,可实现高可靠性通信。同时,因为光信号被完善地限制在光纤结构中,任何泄漏的辐射都被外包材料所吸收,故能提供高度的数据保密性。

6.结束语

综上所述,微处理器应用系统的可靠性在很大程度上都取系统内的抗干扰技术应用。其可靠性设计是一个综合性、经验性较强的问题,是应用系统能否成功应用的关键。严格意义上来说,系统的硬件抗干扰是主动的,而软件抗干扰只是一个补充。可见,只有结合微处理器系统实际特点,分析干扰源,采用硬件与软件相结合的方法,不断地完善系统监控程序,才能够在保证微处理器的有效性、控制精度、控制功能的基础上,大力提高系统的抗干扰性能,确保应用系统的可靠运行。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分