基于开源鸿蒙的RKNN人脸识别应用案例

描述

【拆·应用】是为开源鸿蒙应用开发者打造的技术分享平台,是汇聚开发者的技术洞见与实践经验、提供开发心得与创新成果的展示窗口。诚邀您踊跃发声,期待您的真知灼见与技术火花!

引言

本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,基于RK3588的RKNN人脸识别应用开发全流程。

背景介绍

在边缘计算领域,RK3588作为一款高性能AIoT芯片,具备6TOPS的NPU算力,非常适合部署人脸识别等计算机视觉应用。深圳市视美泰技术股份有限公司(以下简称“视美泰”)基于开源鸿蒙系统,结合Rockchip NPU强大的AI算力,基于RKNN开发了人脸识别应用案例,此案例将RKNN能力与开源鸿蒙进行适配和集成,为开发者提供直观、便捷的AI应用体验。

RKNN介绍

RKNN是瑞芯微推出的神经网络推理加速引擎,Rockchip NPU平台使用的模型类型,RKNN通常应用于边缘设备上的深度学习任务,如人脸识别、物体检测和语音识别等。它是一个强大的神经网络开发和运行框架,简化了深度学习模型开发的多个复杂步骤,并提供了优秀的跨平台支持和模型优化能力。

鸿蒙

技术实现详解

本案例采用双模型推理设计,充分发挥Rockchip NPU的硬件优势:

YOLOv5人脸检测模型:负责实时检测图像中的人脸位置。

FaceNet特征提取模型:提取人脸特征向量,实现精准识别。

检测流程:摄像头采集 → 图像预处理 → RKNN推理 → 结果处理 → UI显示

1.模型加载与初始化

模型加载流程:

(1)首先尝试从应用沙箱目录加载已保存的模型文件。

(2)如果沙箱中不存在,则从rawfile资源中加载。

(3)初始化RKNN上下文,设置使用所有NPU核心(RKNN_NPU_CORE_0_1_2)。

(4)查询模型的输入输出信息,获取tensor属性。

2.预览流图像预处理

(1)首先通过opencv库的imread读取预览流图像。

(2)获取的预览流图像为BGR格式,需要将BGR转为RGB格式。

(3)计算目标尺寸和缩放比例。

(4)再通过计算出来的比例进行自适应缩放和填充,通过opencv库的resize和copyMakeBorder完成调整预览流图像大小和添加填充,这种处理方式可以避免图像变形,提高检测精度。

鸿蒙

3.人脸检测推理执行

(1)准备并设置输入数据参数。

(2)通过rknn_inputs_set设置输入。

(3)对预览流图片执行推理,获取输出结果。

(4)通过后处理函数处理YOLOv5模型的输出,将输出转换为可用的检测结果,包括边界框坐标、类别和置信度。

鸿蒙

4.人脸识别图像预处理

(1)首先根据人脸检测过程中保存的人脸边界坐标数据,对对应的预览流图片进行人脸裁切,将预览流中裁切出来的人脸图尺寸缩放到224*224,将这一尺寸作为标准的人脸识别输入尺寸,将缩放好的图片输出保存。

(2)启动人脸识别工作线程(如果尚未启动)。

(3)获取当前时间戳,查找刚刚输出的缩放好的图片,将时间戳最接近现在时间戳的添加到异步处理队列中。

鸿蒙

5.人脸识别推理流程

(1)将准备推理的人脸图像进行预处理。

(2)准备输入数据并且设置输入。

(3)执行推理,获取输出结果。

(4)查询输出张量的属性(包括零点和缩放因子),将输出向量大小调整为128维,并将量化的int8数据转换回浮点数,实现将模型的量化输出转换回原始特征空间。

(5)最后计算特征向量的平方和,计算L2范数,将特征向量的每个元素除以L2范数归一化后的特征向量长度为1,便于后续使用余弦相似度计算人脸相似性。

鸿蒙

6.获取人脸与人脸库对比

(1)首先人脸库的人脸图像会在应用启动时,自动执行人脸识别推理,并保存从人脸图像中提取的128维特征向量。

(2)再从实时人脸的图像中提取到128维特征向量后,会与人脸库中保存的128维特征向量进行点积计算,因为进行了归一化处理,所以返回值相似度的范围为0.0-1.0,当相似度为0.6以上即为同张人脸。

鸿蒙

NAPI接口

本应用共提供3个NAPI接口,供开发者在ArkTS调用,能够快速实现人脸识别应用的开发:

下列接口返回值中 * 表示仅在成功时存在并返回

saveModelFile - 保存模型文件

鸿蒙

saveFaceDatabaseImages - 保存人脸数据库图片

鸿蒙

processImageWithRKNN - 图像处理与人脸识别

鸿蒙

程序运行流程

展示应用运行时的部分重要函数:

1.应用启动阶段

鸿蒙

2.摄像头初始化

鸿蒙

3.图片处理流水线

鸿蒙

4.RKNN NAPI接口调用

鸿蒙

5.UI渲染与交互

鸿蒙

鸿蒙

技术特点

NPU加速: 充分利用Rockchip NPU的算力,实现高效的模型推理。

多核心支持: 设置使用所有NPU核心,最大化硬件利用率。

异步处理: 人脸识别采用异步处理,不阻塞UI线程。

内存优化: 智能管理模型数据和图像缓存,避免内存泄漏。

实时结果反馈: 提供实时的人脸检测和识别结果。

依赖

1.操作系统及硬件依赖

OpenHarmony系统版本: 仅支持OpenHarmony 5.0.0 Release 64位系统(API 12)。

设备要求: 需要支持Rockchip NPU的设备,案例默认适配RK3588。

2.模型依赖

将所需模型放置在rawfile/model/usemodel/目录下。

yolov5.rknn: 人脸检测模型,需要放置在rawfile/model/usemodel/目录下。

facenet.rknn: 人脸特征提取模型,需要放置在rawfile/model/usemodel/目录下。

3.人脸识别人脸库依赖

将所需识别人物的参考人脸图片放置在rawfile/face_databases目录下,按1-20命名,例如:1.jpg。

应用效果展示

演示使用板卡:视美泰 AIoT-3588A

OpenHarmony版本:OpenHarmony 5.0.0 Release 64位

RKNPU版本: v0.9.8

同一个人不同场景下的识别效果展示

不同人的识别效果展示

总结

本文主要介绍了基于开源鸿蒙系统,将RKNN适配了开源鸿蒙,实现RKNN人脸识别应用案例,可智能识别人脸及与人脸库中的参考人脸进行匹配比对。文中使用搭载开源鸿蒙5.0.0 Release 64位系统的视美泰AIoT-3588A开发板进行应用案例效果展示。

应用源码获取

RKNN人脸识别应用案例相关源码均已上传至gitcode。

仓库地址:https://gitcode.com/openharmony-sig/applications_ai_model_samples/tree/master/RknnFacialRecognitionDemo_api12

  开源鸿蒙 64位固件以及烧录文档链接:

  https://pan.baidu.com/s/1kgLCKylfeaYkuaBwehInBw?pwd=mf6t

  提取码:mf6t

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分