DEEPX算力卡，功耗不到3W！搭载RK3588实测，25TOPS加持，助力AI视觉升级！

Tronlong创龙科技 2026-05-08 306

电子说

1.4w人已加入

在智能机器人、工业视觉等边缘计算场景中，如何在高算力与低功耗之间找到最佳平衡点，一直是行业痛点。创龙科技基于瑞芯微RK3588高性能工业评估板，已成功适配DEEPX DX-M1算力加速卡，为边缘AI应用提供了全新的高性能解决方案。

▍算力强劲，小巧低耗

DX-M1BNM5604是一款基于DEEPX DX-M1处理器设计的高性能、低功耗AI算力加速卡，具有如下特点：

极致算力：基于高性能AI架构，支持INT8，算力高达25TOPS。

高速存储：板载2片LPDDR5，总容量高达4GByte，数据吞吐大。

极速传输：支持PCIe 3.0(4Lane)，具备高吞吐量输入输出能力，保障任务流畅运行。

超低功耗：最低功耗仅2.69W，绿色节能，散热压力小。

小巧便携：尺寸仅为80*22*4.7mm，重量约9.7g，易于嵌入各种设备。

框架兼容：全面支持TensorFlow、PyTorch、ONNX、Keras等主流深度学习框架。

▍硬核实测，性能炸裂

为了验证适配效果，我们在DX-M1 M.2 AI算力加速卡上运行了经典的yolov5s目标检测模型，测试数据显示，在运行yolov5s模型时，平均处理帧率高达652.8fps，性能表现很优秀。

根据官方数据手册，DX-M1算力加速卡运行各类AI模型的功耗及推理性能(FPS)如下：

在运行YoloV9T模型时，功耗最低仅2.69W，展现了出色的能效控制能力。这种低功耗特性使得该方案特别适合对功耗敏感的边缘部署场景。

▍全栈工具，开发无忧

DEEPX提供了完善的DXNN软件框架和工具链，大幅降低开发门槛，助力开发者快速落地。

AI模型编译环境(Compile Environment)

包含DX-COM、DX-TRON、DX-Model Zoo。其中DX-COM是DEEPX SDK中的编译器，能够根据ONNX模型和JSON配置文件生成经过硬件优化的.dxnn二进制文件，从而在DEEPX NPU上实现低延迟、高效率的推理运算。

AI模型运行环境(Runtime Environment)

包含DX-APP、DX-STREAM、DX-RT等。其中DX-RT（运行时）通过固件和设备驱动与DEEPX NPU直接交互，利用PCIe接口实现主机与NPU之间的高速数据传输，并为应用程序提供C/C++和Python API以进行推理控制。

▍工业优选，场景落地

DEEPX算力加速卡引出M.2 Key M接口，可适配创龙科技RK3576、RK3588等工业单板机及创龙科技RK3576等工业评估板，亦可通过M.2转PCIe转接板与创龙科技RK3588等工业评估板搭配使用。

目前，创龙科技已完成RK3588工业评估板 + DX-M1评估套件的适配工作，可提供详细测试步骤文档。

RK3588负责多任务调度与复杂逻辑处理，DX-M1专注高负载AI推理，该组合可广泛应用于智能机器人、工业视觉检测、输电线路巡检、铁路巡防等场景，为端侧AI部署提供强劲算力支撑。

审核编辑黄宇

打开APP阅读更多精彩内容