电子说
在智能机器人、工业视觉等边缘计算场景中,如何在高算力与低功耗之间找到最佳平衡点,一直是行业痛点。创龙科技基于瑞芯微RK3588高性能工业评估板,已成功适配DEEPX DX-M1算力加速卡,为边缘AI应用提供了全新的高性能解决方案。
▍算力强劲,小巧低耗
DX-M1BNM5604是一款基于DEEPX DX-M1处理器设计的高性能、低功耗AI算力加速卡,具有如下特点:
极致算力:基于高性能AI架构,支持INT8,算力高达25TOPS。
高速存储:板载2片LPDDR5,总容量高达4GByte,数据吞吐大。
极速传输:支持PCIe 3.0(4Lane),具备高吞吐量输入输出能力,保障任务流畅运行。
超低功耗:最低功耗仅2.69W,绿色节能,散热压力小。
小巧便携:尺寸仅为80*22*4.7mm,重量约9.7g,易于嵌入各种设备。
框架兼容:全面支持TensorFlow、PyTorch、ONNX、Keras等主流深度学习框架。

▍硬核实测,性能炸裂
为了验证适配效果,我们在DX-M1 M.2 AI算力加速卡上运行了经典的yolov5s目标检测模型,测试数据显示,在运行yolov5s模型时,平均处理帧率高达652.8fps,性能表现很优秀。

根据官方数据手册,DX-M1算力加速卡运行各类AI模型的功耗及推理性能(FPS)如下:

在运行YoloV9T模型时,功耗最低仅2.69W,展现了出色的能效控制能力。这种低功耗特性使得该方案特别适合对功耗敏感的边缘部署场景。
▍全栈工具,开发无忧
DEEPX提供了完善的DXNN软件框架和工具链,大幅降低开发门槛,助力开发者快速落地。


AI模型编译环境(Compile Environment)
包含DX-COM、DX-TRON、DX-Model Zoo。其中DX-COM是DEEPX SDK中的编译器,能够根据ONNX模型和JSON配置文件生成经过硬件优化的.dxnn二进制文件,从而在DEEPX NPU上实现低延迟、高效率的推理运算。
AI模型运行环境(Runtime Environment)
包含DX-APP、DX-STREAM、DX-RT等。其中DX-RT(运行时)通过固件和设备驱动与DEEPX NPU直接交互,利用PCIe接口实现主机与NPU之间的高速数据传输,并为应用程序提供C/C++和Python API以进行推理控制。
▍工业优选,场景落地
DEEPX算力加速卡引出M.2 Key M接口,可适配创龙科技RK3576、RK3588等工业单板机及创龙科技RK3576等工业评估板,亦可通过M.2转PCIe转接板与创龙科技RK3588等工业评估板搭配使用。
目前,创龙科技已完成RK3588工业评估板 + DX-M1评估套件的适配工作,可提供详细测试步骤文档。


RK3588负责多任务调度与复杂逻辑处理,DX-M1专注高负载AI推理,该组合可广泛应用于智能机器人、工业视觉检测、输电线路巡检、铁路巡防等场景,为端侧AI部署提供强劲算力支撑。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !