你是否真的会在Flash上存数据?

描述

在应用编程(IAP)应该是MCU使用过程中常见的一种功能,MCU厂商为了加速用户的产品开发,都会在其SDK中添加相关示例,而且也有不少用户只需要简单的集成,就完成了该功能并实现产品的量产。但你是否真的会在Flash上存数据?

首先我们需要从片内和片外存储谈起,MCU内部的非易失性存储器绝大多数都是基于FLASH的(也有少部分是EEPROM的,比如NXP LPC80x系列),MCU外部的非易失性存储器可以有FLASH,EEPROM,其中EEPROM比较常见的是I2C接口,FLASH有NAND, NOR, SPI NOR等等。

实际应该过程中,我们到底应该怎么选择呢?需要存储的数据量大小是首要问题,我们可以根据它来大致设定规则

数据
  1. 当数据量大于128MB时,NAND FLASH或者SD(TF)卡是常见的选择,但考虑到NAND FLASH会有坏块的问题,编写存储软件时需要考虑磨损均衡已经坏块管理的问题,想要做的非常可靠并不容易。

  2. 当数据量小于128MB,大于2MB时,可以选择NOR FLASH或EEPROM,EEPROM技术上的优势是耐久性好,可以反复多次编程,最高可达100W次的擦写循环,NOR FLASH相比EEPROM容量会更大,平均成本更好,但是寿命会少个0,最大只能到10W次的擦写循环。

    EEPROM(AT24C02)

    数据

    FLASH(IS25WP032)

    数据
  3. 当数据量小于2MB时,就可以考虑将其放入MCU内部的FLASH中,一旦决定把数据放MCU内部FLASH时,就面临两个问题:

    (1)MCU片内FLASH承诺的寿命更短,一般可能是1~5W次,好像也有几百次的,鉴于大佬已经停线,这里就不点名了。关于这个参数切记要参考手册,不同厂家的参数不一样,同一厂家的不同系列也可能有差异

    NXP Kinetis系列MCU

    数据

    STM32 F103xx

    数据

    (2) 擦写过程可能需要关闭中断,虽然这个不是必须的,但除非MCU的Datasheet明确有写支持,绝大多数MCU都是有这方面的要求,并且IAP编程的函数需要运行于RAM或ROM中,因为擦写过程中,如果MCU没有特殊的设计(比如下图NXP Kinetis K64系列带有双Block flash是可以支持WWR),该过程是无法进行取指的,关中断的目的是防止外部中断触发运行于FLASH上的ISR,如果用户不希望关中断,则必须要将可能发生中断的函数Relocate到RAM中

    数据
    //RAM中执行的编程函数
    static status_t flash_command_sequence(flash_config_t *config)
    {
        uint8_t registerValue;
    
    __set_PRIMASK(1);
    
    #if FLASH_DRIVER_IS_FLASH_RESIDENT
        /* clear RDCOLERR & ACCERR & FPVIOL flag in flash status register */
        FTFx->FSTAT = FTFx_FSTAT_RDCOLERR_MASK | FTFx_FSTAT_ACCERR_MASK | FTFx_FSTAT_FPVIOL_MASK;
    
        status_t returnCode = flash_check_execute_in_ram_function_info(config);
        if (kStatus_FLASH_Success != returnCode)
        {
        __set_PRIMASK(0);
            return returnCode;
        }
    
        /* We pass the ftfx_fstat address as a parameter to flash_run_comamnd() instead of using
         * pre-processed MICRO sentences or operating global variable in flash_run_comamnd()
         * to make sure that flash_run_command() will be compiled into position-independent code (PIC). */
        callFlashRunCommand((FTFx_REG8_ACCESS_TYPE)(&FTFx->FSTAT));
    __set_PRIMASK(0);
    #else
        /* clear RDCOLERR & ACCERR & FPVIOL flag in flash status register */
        FTFx->FSTAT = FTFx_FSTAT_RDCOLERR_MASK | FTFx_FSTAT_ACCERR_MASK | FTFx_FSTAT_FPVIOL_MASK;
    
        /* clear CCIF bit */
        FTFx->FSTAT = FTFx_FSTAT_CCIF_MASK;
    
        /* Check CCIF bit of the flash status register, wait till it is set.
         * IP team indicates that this loop will always complete. */
        while (!(FTFx->FSTAT & FTFx_FSTAT_CCIF_MASK))
        {
        }
    #endif /* FLASH_DRIVER_IS_FLASH_RESIDENT */
    
        /* Check error bits */
        /* Get flash status register value */
        registerValue = FTFx->FSTAT;
    
        /* checking access error */
        if (registerValue & FTFx_FSTAT_ACCERR_MASK)
        {
        __set_PRIMASK(0);
            return kStatus_FLASH_AccessError;
        }
        /* checking protection error */
        else if (registerValue & FTFx_FSTAT_FPVIOL_MASK)
        {
        __set_PRIMASK(0);
            return kStatus_FLASH_ProtectionViolation;
        }
        /* checking MGSTAT0 non-correctable error */
        else if (registerValue & FTFx_FSTAT_MGSTAT0_MASK)
        {
        __set_PRIMASK(0);
            return kStatus_FLASH_CommandFailure;
        }
        else
        {
        __set_PRIMASK(0);
            return kStatus_FLASH_Success;
        }
    }
    

    (3) 擦写时间对系统的影响,之前讲过擦写过程是不能执行FLASH code的,所以势必会让系统pending住,而这个pending时间可以在Datasheet中寻找答案,一般擦除是按照sector/block大小来的,编程时按照word或者page大小来的,擦除时间一般更长,对系统影响更大。用户需要考虑的是系统是否可以接受每个控制周期,等待1个擦除最小单位的编程时间,这是由于有可能需要编程的数据比较大,如果同一时间更新势必会影响到控制周期,但如果把擦写任务分配到每个控制周期,就可以将影响降低到最小,以NXP Kinetis,擦除一个Sector典型值是14ms,每次写入Longword(8字节)所需要的时间是65us,当需要升级的时候,在接收到升级命令的第一帧处理时,增加sector删除命令,本次运算周期会增加14ms的pending时间,然后每周期编程8字节数据。如果系统需要将数据存在内部flash上,就必须接受某一个周期增加14ms的pending,随着flash写入次数的增多,14ms还会增大到114ms

    数据

在确定了上述问题之后就可以完成存储设备的选型,但软件处理还需要注意以下几个要点,这些问题MCU厂家一般是不会提供解决方案的,需要用户根据自己的需求来完成:

  1. 冗余备份:有些时候用户需要更新正在使用的参数/固件,考虑到更新失败的情况下,需要支持参数/固件版本回退,所以需要两片备份区进行冗余备份。

    数据
  2. Magic number or 校验码:Magic number一般就是在FLASH编程结束时候,写一个位数较高的(64bit)值到固定地址,使用加载数据时,先判断Magic number是否正确,以此判断编程过程是否完整,切记Magic number要在编程时先擦后写(第一个擦,最后一个写),否则无法起到验证效果。这种验证方式比较初级,对于可靠性要求更高的场合,一般会使用校验码的方式(CRC或者MD5),特别是参数文件通过通信的方式传输到MCU中,虽然通信过程可能也有校验(比如Modbus RTU的CRC),但是无法保证数据在RAM缓冲区不发生位翻转的情况,大多数MCU都不支持ECC功能,在这种情况下是无法纠错的,如果对端设备会将文件的校验码发过来进行校验,就可以避免该问题的发生,虽然RAM出现位翻转的概率非常低,但是如果发生位翻转的参数是设备的保护点或者PWM死区值,一旦出现错误,就可能会发生设备故障或损毁,甚至出现安全事故。

    数据
  3. 编程过程掉电或复位:在编程的过程中出现掉电或者复位是经常出现的一种异常情况。比如震动导致电源接触不良,或者系统异常导致看门狗无法喂狗都有可能出现,还有使用POE电源对端设备直接断电都有可能造成这种异常。所有一定要考虑在这种情况下的异常处理,比如上电加载数据的时候,如果校验失败,可以使用一组安全数据或者更新前的数据。对于带操作系统的应用,建议硬件添加系统掉电检测电路,在检测到掉电事件(如24V掉电)发生时,如果当前没有写入Flash,则lock住写入进程,如果当前正在写入Flash,则立即调用sync函数,尽快将数据从缓存写入Flash(硬件上MCU VDD加个稍微大点的电容,多扛一段时间),不要等待系统后台写入。

    数据
  4. 二次编程:有些MCU内部的Flash是带有校验机制的,对于同一地址在擦除完成后,只能进行一次编程,如果进行二次编程写入不同数值进去,可能会除非校验失败,导致该地址无法正常读写。

总结,这里列了一个表格,当需要IAP的时候,可以根据所选芯片的参数判断是否满足自身系统的需求(下表已经填入示例数据):

NVM 擦除编程最小单元 擦除编程所用时间 擦除编程寿命 编程过程是否需要关中断 编程数据的校验 编程过程中掉电/复位
EEPROM 不需要擦,可以按字节或者Page写入 写周期5ms 1000000 不需要 软件添加 软件添加
NOR FLASH Sector = 4K, 最小写入Page = 256B Sector擦70ms,Page写0.2ms 100000 不需要 软件添加 软件添加
MCU FLASH Sector = 2KB, 最小写入8Byte Sector擦14ms,写65us 50000 需要 软件添加 软件添加
审核编辑 :李倩

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分