超星未来NE100开箱体验，15分钟部署目标检测模型

超星未来 2023-09-27 870

描述

「NE100」是超星未来基于自研计算芯片「惊蛰R1」和全流程开发工具链「鲁班」打造的智能计算平台开发套件，包括完备的推理环境。其中鲁班工具链以 docker 形式提供，完整包括剪枝、量化、编译工具以及相应实例。NE100 配套完整，开箱即用，无需繁琐的安装过程。

下面以目标检测模型 YOLOv5 为例，展示部署过程。

注：开发环境为 Linux 系统的 PC 或服务器，神经网络需要导出为 ONNX 格式文件。

可通过标准命令加载工具链 docker 文件：

gunzip -c nova_development_kit.tar.gz | sudo docker load

参考用户手册中示例脚本启动容器，进入开发环境。

基于原始模型导出 ONNX 文件时，请确保网络已经处于推理模式，并且计算图的输入节点为首个 CONV 算子的输入(格式[1,C,H,W])，输出节点为最后一个（组）CONV 算子的输出，详细信息请参考用户手册。

#1 模型量化与编译

1个API，5行代码，轻松完成

量化工具以 ONNX 文件和部分图片为输入，将神经网络从 FP32 量化为 INT8 精度，目前支持 PTQ 与 QAT 功能。仅需在代码中将量化和编译工具导入并通过 API 调用，即可对 ONNX 模型完成量化和编译，分别只需要1个 API 和5行代码。详细的 API 说明请参考用户手册。

1. 导入量化工具

from nquantizer import run_quantizer

2. 调用量化工具

quant_model = run_quantizer( 
    onnx_model,
    dataloader=val_loader,
    num_batches=200,
    output_dir=work_dir + "/quantizer_output",
    input_vars=input_vars,
)

3. 导入编译工具

from ncompiler import run_compiler

4. 调用编译工具

run_compiler(
    input_dir=work_dir + "/quantizer_output",
    output_dir=work_dir + "/compiler_output",
    enable_simulator=True,
    enable_profiler=True,
)

编译后 compiler_output 目录中的 npu.param（模型结构描述文件）和 npu.bin（模型权重文件）是 NE100 部署时所需要的文件。