瑞萨电子宣布推出针对人工智能(AI)、机器学习(ML)应用以及实时分析的RA8P1微控制器(MCU)产品群。该系列MCU通过将1GHz Arm Cortex-M85和250MHz Cortex-M33 CPU核心与Arm EthosTM-U55神经处理单元(NPU)相结合,从而树立MCU性能的新标杆。作为瑞萨电子深度合作伙伴,RT-Thread已率先完成对该芯片的适配支持。本文将详解如何快速移植RT-Thread,带大家一起体验M85!

目录
芯片介绍
RT-Thread 移植
测试结果
总结
1
芯片介绍

从数据手册上看出 RA8P1 是一颗双核异构的芯片,由大核 Cortex-M85 +小核 Cortex-M33 组成。在此基础上额外集成了 NPU 运算单元,专门用于加速机器学习推论所设计。
主频上,M85主核心竟然达到了1GHZ,这个速度是以往系列都没有的主频,一个字“快”,
M33 从核心主频是 250MHZ,同时 RA8P1 有 64KB 的数据+指令 Cache,其中我手上这颗 R7KA8P1KFLCAC 芯片: CPU0 和 CPU1对应的 I/D Caches 和 C/S Caches 容量各 32KB。
外设接口上,RA8P1最多的支持10路SCI外设接口(可以灵活配置成UART,SPI,I2C),OSPI x 2可以拓展外扩最高8线 的 Hyperam,flash 等存储器件。
人机交互接口上,和RA8D1一样支持 MIPI-DSI,GLCDC 可以二选一搭配 MIPI/RGB 接口的屏幕使用。
除CEU(数字摄像头接口)外,视频输入接口新增MIPI-CSI外设,显著提升摄像头数据带宽,确保AI处理场景下前置输入带宽的稳定性。

在网络接口上,RA8P1支持L3以太网交换机模块(ESWM),允许连接到网络的各种设备进行数据交换和相互通信。其支持多协议接口,它能够在同一网络或不同网络接口协议之间自主路由帧数据,适用于网关应用。

2
RT-Thread 移植
让我们快速移植 RT-Thread体验下:
参考RT-Thread文档中心针对RA系列的 BSP制作教程 + Vision Board SDK仓库,由于RA8P1的启动方式是大核先启动,那么我们可以先以单核方式快速移植RTT,这里不多加赘述。
下载 E2Studio 即可快速体验裸机开发;
将 RT-Thread 源码加入工程,加入设备驱动框架对接层;
运行 RT-Thread 的基本条件是Systick时钟和串口驱动,对于RT-Thread中已经实现的非常完善;
外设上在FSP中只需要配置一个通讯的串口即可

正式开始移植
在移植过程中可以用过E2Studio进行针对多核进行调试仿真,体验下来也是比较流畅的:

如果想要启动从核(M33)可以直接调用FSP封装好的库函数:

至此RT-Thread已经正常的运行起来了:

在BSP根目录下启动env工具:RT-Thread具有完善的软件生态,我们可以快速的针对芯片进行性能测试,那么有请第一个软件包登场:CoreMark

使用 env 配置工具 在软件包仓库中使能 COREMARK 软件包,通过 pkgs --update 拉取到本地项目中参与构建:

设置 corkmark 运算迭代次数为:80000(按需设置,对于性能较强的芯片需要增加次数)

在 hal_entry.c 中,执行 coremark 程序进行跑分测试:

初步使用O0等级优化测试结果:

什么M85内核才区区500分?这和理想中的分数天差地别了,接下来开始进行优化:
1 开启Dcache和Icache:

qemu-system-riscv32 -machine smartl -nographic -kernel rtthread.elf -cpu e906fd -gdb tcp::23333 -S
2 修改测试区域内存为DTCM段:

3
测试结果
CPU0:Cortex-M85 储存介质:MRAM(磁阻式随机存取内存)
编译器版本 : GCC13.2.1
编译参数:-mfloat-abi=hard -mfpu=fpv5-sp-d16 Ofast
Coremark分数:4896.132056

CPU1:Cortex-M33
储存介质:MRAM(磁阻式随机存取内存)
编译器版本 : GCC13.2.1
编译参数:-mfloat-abi=hard -mfpu=fpv5-sp-d16 Ofast
Coremark分数:570.356473

以上的测试结果是使用GCC工具链进行编译,更换成 ARMCLANG/LLVM 工具链跑分可能还会提升一些。
4
总结
RA8P1芯片搭载双核异构M85和M33内核,相较前代RA8系列在主频、带宽及外设接口方面实现显著性能提升,并集成Ethos-U55 NPU的32位AI加速微控制器(MCU)。
该芯片在语音、视觉及实时分析AI场景中表现出色,性能强劲。后续计划移植RP-Msglite组件,结合RT-Thread在RA8P1上实现双核间高效数据通信,充分释放双核性能潜力。
全部0条评论
快来发表一下你的评论吧 !