OpenVINOSharp常用API详解与演示

描述

作者:颜国进 英特尔边缘计算创新大使

技术指导:武卓,李翊玮

 

OpenVINO 工具套件可以加快深度学习视觉应用开发速度,帮助用户在从边缘到云的各种英特尔平台上,更加方便快捷的将 AI 模型部署到生产系统中。

C# 是由 C 和 C++ 衍生出来的一种安全的、稳定的、简单的、优雅的面向对象编程语言,它综合了 VB 简单的可视化操作和 C++ 的高运行效率,成为支持成为.NET 开发的首选语言。作为人工智能开发人员,如果你希望在 C# 端使用 OpenVINO ,OpenVINOSharp 将是你的首选,并且制作了 NuGet 程序包,实现在 C# 端了一站式安装与使用 OpenVINO

OpenVINOSharp 在制作时参考了 OpenVINO C++ API,因此对于之前使用过 OpenVINO 的人十分友好。下面表格向我们展示了 C# 与 C++ API 的对应关系

C++

在本文中,将会根据模型部署的一般步骤,演示从模型加载到推理的方法函数使用方式,并于 C++ API 做对比。

1.1安装 OpenVINOSharp

OpenVINOSharp 支持 NuGet 程序包安装方式,这与在 C++ 中安装过程相比,较为简单,并且程序包中包含了 OpenVINO 2023.0 发行版本,可以通过 NuGet 安装后直接使用。

如果使用 Visual Studio 编译该项目,则可以通过 NuGet 程序包管理功能直接安装即可:

C++

如果通过 dotnet 命令方式安装,通过下面语句进行安装即可:

 

dotnet add package OpenVinoSharp.win

 

向右滑动查看完整代码

1.2导入程序集

OpenVINOSharp 程序集全部在命名空间 OpenVinoSharp 下,因此若要使用 OpenVINOSharp ,需要先引入命名空间:

 

using OpenVinoSharp

 

1.3初始化 OpenVINO 运行时内核

Core 类代表一个 OpenVINO 运行时核心实体,后续的读取模型、加载模型等方法都需要通过 Core 类进行创建,在封装 C# API 时,为了与 C++ API 对应,也对 Core 类进行了封装,并封装了与 C++ API 中对应的方法。

在 C# 中的初始化方式:

 

Core core = new Core()

 

在 C++ 中的初始化方式:

 

ov::Core core;

 

1.4加载并获取模型信息

1.4.1   加载模型

OpenVINO 2022.1版本更新之后,加载,下面是所使用的 API 方法:

API 作用
Core.read_model () 将模型从硬盘载入内存,并返回Model对象。

在 C# 中加载模型的方式:

 

Model model = core.read_model(model_path);

 

向右滑动查看完整代码

在 C++ 中的初始化方式:

 

std::shared_ptrmodel = core.read_model(model_path);

 

向右滑动查看完整代码

1.4.1   获取模型信息

通过 Core.read_model () 方法获得的 Model 对象和通过 Core.compile_model () 方法获得的 CompiledModel 对象,都支持直接访问属性获取输入与输出层信息。以 Model 对象获取模型信息为例,下面是所使用的 API 方法:

API 作用
Model.get_friendly_name() 获取模型的friendly name。
Model.input() 获取模型的输入层,并返回 Input 对象。
Model.output() 获取模型的输出层,并返回 Output 对象。

Input/Output 主要是封装了模型网络层,可以通过下面 API 实现获取模型的详细信息:

API 作用
Output.get_any_name() 获取模型网络层的名字。
Output.get_element_type() 获取模型网络层的数据类型,并返回 OvType 对象,OvType 主要封装了网络的基本数据类型。
Output.get_shape() 获取模型网络层的形状,并返回 Shape 对象,Shape 封装了网络层的形状数组。

在 C# 中通过下方代码,可以直接获取模型的输入、输入层以及模型的 friendly name:

 

string model_name = model.get_friendly_name();
Input input = model.input();
Output output = model.output();

 

向右滑动查看完整代码

然后将模型具体信息打印到控制台页面:

 

Console.WriteLine("Model name: {0}", model_name);
Console.WriteLine("/------- [In] -------/");
Console.WriteLine("Input name: {0}", input.get_any_name());
Console.WriteLine("Input type: {0}", input.get_element_type().to_string());
Console.WriteLine("Input shape: {0}", input.get_shape().to_string());
Console.WriteLine("/------- [Out] -------/");
Console.WriteLine("Output name: {0}", output.get_any_name());
Console.WriteLine("Output type: {0}", output.get_element_type().to_string());
Console.WriteLine("Output shape: {0}", output.get_shape().to_string());

 

向右滑动查看完整代码

获取模型网络层信息如下:

 

Model name: torch_jit
/------- [In] -------/
Input name: data
Input type: float
Input shape: [1,3,224,224]
/------- [Out] -------/
Output name: prob
Output type: float
Output shape: [1,1000]

 

向右滑动查看完整代码

同样的输出信息,我们使用 C++ API 实现如下:

 

std::cout << "Model name: " << model->get_friendly_name() << std::endl;
ov::Output input = model->input();
std::cout << "/------- [In] -------/" << std::endl;
std::cout << "Input name: " << input.get_any_name() << std::endl;
std::cout << "Input type: " << input.get_element_type().c_type_string() << std::endl;
std::cout << "Input shape: " << input.get_shape().to_string() << std::endl;
ov::Output output = model->output();
std::cout << "/------- [Out] -------/" << std::endl;
std::cout << "Output name: " << output.get_any_name() << std::endl;
std::cout << "Output type: " << output.get_element_type().c_type_string() << std::endl;
std::cout << "Output shape: " << output.get_shape().to_string() << std::endl;

 

向右滑动查看完整代码

1.5编译模型并创建推理请求

在读取本地模型后,调用模型编译方法将模型编译为可以在目标设备上执行的 compile_model 对象,并通过该对象创建用于推断已编译模型的推断请求对象。下面是所使用的 API 方法:

API 作用
Core.compile_model() 将模型编译为可以在目标设备上执行的 compile_model 对象。
CompiledModel.create_infer_request() 创建用于推断已编译模型的推断请求对象,创建的请求已经分配了输入和输出张量。

在 C# 中编译模型并创建推理请求的方式:

 

CompiledModel compiled_model = core.compile_model(model, "AUTO");
InferRequest infer_request = compiled_model.create_infer_request();

 

向右滑动查看完整代码

使用 C++ API 中编译模型并创建推理请求的方式:

 

CompiledModel compiled_model = core.compile_model(model, "AUTO");
InferRequest infer_request = compiled_model.create_infer_request();

 

向右滑动查看完整代码

1.6张量Tensor

1.6.1   张量的获取与设置

在创建推理请求后,系统会自动创建和分配输入和输出的张量,张量可以通过 InferRequest 对象获得,并且可以自定义张量并加载到模型指定节点;可以根据张量的输入输出序号、名称以及模型节点 Node 对象获取和设置,主要 C# API 如下:

API 作用
InferRequest.set_tensor() 设置要推断的输入/输出张量。
InferRequest.set_input_tensor() 设置要推断的输入张量。
InferRequest.set_output_tensor() 设置要推断的输出张量
InferRequest.get_tensor() 获取用于推理的输入/输出张量。
InferRequest.get_input_tensor() 获取用于推理的输入张量。
InferRequest.get_output_tensor() 设置要推理的输出张量

1.6.2   张量的信息获取与设置

张量中主要包含的信息有张量的形状 (Shape)、张量的数据格式 (OvType-> element.Type) 以及张量中的内存数据。可以通过以下 API 方法操作张量的参数:

API 作用
Tensor.set_shape () 给张量设置一个新的形状。
Tensor.get_shape() 获取张量的形状。
Tensor.get_element_type() 获取张量的数据类型。
Tensor.get_size() 获取张量的数据长度。
Tensor.get_byte_size() 获取张量的字节大小。
Tensor.data() 获取张量的内存地址。
Tensor.set_data() 将指定类型的数据加载到张量内存下。
Tensor.get_data() 从张量中读取指定类型的数据。

以上方法是对张量的一些基础操作,除了 set_data、get_data 是 OpenVINOSharp 独有的,其他接口都与 C++API 一致。

1.7加载推理数据

1.7.1   获取输入张量

对于单输入的模型可以直接通过 get_input_tensor() 方法获得,并调用 Tensor 的相关方法获取 Tensor 的相关信息,C# 代码如下所示:

 

Tensor input_tensor = infer_request.get_input_tensor();
Console.WriteLine("/------- [Input tensor] -------/");
Console.WriteLine("Input tensor type: {0}", input_tensor.get_element_type().to_string());
Console.WriteLine("Input tensor shape: {0}", input_tensor.get_shape().to_string());
Console.WriteLine("Input tensor size: {0}", input_tensor.get_size());

 

向右滑动查看完整代码

获取输出结果为:

 

/------- [Input tensor] -------/
Input tensor type: f32
Input tensor shape: Shape : {1, 3, 224, 224}
Input tensor size: 150528

 

向右滑动查看完整代码

对于上述的同样输出内容,我们也可以通过 C++ API 实现,C++ 代码如下:

 

ov::Tensor input_tensor = infer_request.get_input_tensor();
std::cout << "/------- [Input tensor] -------/" << std::endl;
std::cout << "Input tensor type: " << input_tensor.get_element_type().c_type_string() << std::endl;
std::cout << "Input tensor shape: " << input_tensor.get_shape().to_string() << std::endl;
std::cout << "Input tensor size: " << input_tensor.get_size() << std::endl;

 

向右滑动查看完整代码

1.7.2   添加推理数据

这一步主要是将处理好的图片数据加载到 Tensor 数据内存中,OpenVINO 的 API 中提供了访问内存地址的接口,可以获取数据内存首地址,不过为了更好的加载推理数据,我们此处封装了 set_data() 方法,可以实现将处理后的图片数据加载到数据内存上。在 C# 中的代码为:

 

Mat input_mat = new Mat();
Shape input_shape = input_tensor.get_shape();
long channels = input_shape[1];
long height = input_shape[2];
long width = input_shape[3];
float[] input_data = new float[channels * height * width];
Marshal.Copy(input_mat.Ptr(0), input_data, 0, input_data.Length);
input_tensor.set_data(input_data);

 

向右滑动查看完整代码

下面是在 C++ 中实现上述功能的代码:

 

cv::Mat input_mat;
float* input_data = input_tensor.data();
ov::Shape input_shape = input_tensor.get_shape();
size_t channels = input_shape[1];
size_t height = input_shape[2];
size_t width = input_shape[3];
for (size_t c = 0; c < channels; ++c) {
    for (size_t h = 0; h < height; ++h) {
        for (size_t w = 0; w < width; ++w) {
            input_data[c * height * width + h * width + w] = input_mat.at>(h, w)[c];
        }
    }
}

 

向右滑动查看完整代码

1.8模型推理

在加载完推理数据后,就可以调用模型推理的 API 方法推理当前数据,主要使用到的 API 方法为:

API 作用
InferRequest.infer() 在同步模式下推断指定的输入。

调用该方法也较为简单,只需要调用该 API 接口即可,在 C# 中的代码为:

 

infer_request.infer();

 

向右滑动查看完整代码

C++ 中的代码与 C++ 中一致。

1.9获取推理结果

对于单输出的模型可以直接通过 get_output_tensor() 方法获得,并调用 Tensor 的相关方法获取 Tensor 的相关信息,C# 代码如下所示:

 

Tensor output_tensor = infer_request.get_output_tensor();
Console.WriteLine("/------- [Output tensor] -------/");
Console.WriteLine("Output tensor type: {0}", output_tensor.get_element_type().to_string());
Console.WriteLine("Output tensor shape: {0}", output_tensor.get_shape().to_string());
Console.WriteLine("Output tensor size: {0}", output_tensor.get_size());

 

向右滑动查看完整代码

获取输出 output_tensor 信息为:

 

/------- [Output tensor] -------/
Output tensor type: f32
Output tensor shape: Shape : {1, 1000}
Output tensor size: 1000

 

向右滑动查看完整代码

对于输出 Tensor,我们只需要读取输出内存上的数据即可,此处我们封装了 get_data() 方法,可以直接获取输出内存上的数据,在 C# 中的代码为:

 

float[] result = output_tensor.get_data(1000);

 

向右滑动查看完整代码

同样获取推理结果,在 C++ 中的代码为:

 

const float* output_data = output_tensor.data();
float result[1000];
for (int i = 0; i < 1000; ++i) {
result[i] = *output_data;
output_data++;
}

 

向右滑动查看完整代码

在获取结果后,后续的处理需要根据模型的输出类型做相应的处理。

1.10释放分配的内存

由于 C# 在封装时采用的 C API 接口实现的,因此在 C# 中会产生较多的非托管内存,若该对象出现循环重复创建,会导致过多的内存未释放导致内存泄漏,因此对于临时创建的对象在使用后要即使销毁,销毁方式也较为简单,只需要调用对象的 dispose() 方法即可。

 

output_tensor.dispose();
input_shape.dispose();
infer_request.dispose();
compiled_model.dispose();
input.dispose();
output.dispose();
model.dispose();
core.dispose();

 

1.11 Yolov8 分类模型示例

下面代码展示了 Yolov8 分类模型使用 OpenVINOSharp API 方法部署模型的完整代码:

 

using OpenCvSharp;
using OpenCvSharp.Dnn;
using OpenVinoSharp;
using System.Data;
using System.Runtime.InteropServices;


namespace test_openvinosharp_api
{
    internal class Program
    {
        static void Main(string[] args)
        {
            string model_path = "E:\GitSpace\OpenVinoSharp\model\yolov8\yolov8s-cls.xml";
            Core core = new Core(); // 初始化推理核心
            Model model = core.read_model(model_path); // 读取本地模型
            CompiledModel compiled_model = core.compile_model(model, "AUTO"); // 便哟模型到指定设备


            // 获取模型的输入输出信息
            Console.WriteLine("Model name: {0}", model.get_friendly_name());
            Input input = compiled_model.input();
            Console.WriteLine("/------- [In] -------/");
            Console.WriteLine("Input name: {0}", input.get_any_name());
            Console.WriteLine("Input type: {0}", input.get_element_type().to_string());
            Console.WriteLine("Input shape: {0}", input.get_shape().to_string());
            Output output = compiled_model.output();
            Console.WriteLine("/------- [Out] -------/");
            Console.WriteLine("Output name: {0}", output.get_any_name());
            Console.WriteLine("Output type: {0}", output.get_element_type().to_string());
            Console.WriteLine("Output shape: {0}", output.get_shape().to_string());
            // 创建推理请求
            InferRequest infer_request = compiled_model.create_infer_request();
            // 获取输入张量
            Tensor input_tensor = infer_request.get_input_tensor();
            Console.WriteLine("/------- [Input tensor] -------/");
            Console.WriteLine("Input tensor type: {0}", input_tensor.get_element_type().to_string());
            Console.WriteLine("Input tensor shape: {0}", input_tensor.get_shape().to_string());
            Console.WriteLine("Input tensor size: {0}", input_tensor.get_size());
            // 读取并处理输入数据
            Mat image = Cv2.ImRead(@"E:GitSpaceOpenVinoSharpdatasetimagedemo_7.jpg");
            Mat input_mat = new Mat();
            input_mat = CvDnn.BlobFromImage(image, 1.0 / 255.0, new Size(224, 224), 0, true, false);
            // 加载推理数据
            Shape input_shape = input_tensor.get_shape();
            long channels = input_shape[1];
            long height = input_shape[2];
            long width = input_shape[3];
            float[] input_data = new float[channels * height * width];
            Marshal.Copy(input_mat.Ptr(0), input_data, 0, input_data.Length);
            input_tensor.set_data(input_data);
            // 模型推理
            infer_request.infer(); 
            // 获取输出张量
            Tensor output_tensor = infer_request.get_output_tensor();
            Console.WriteLine("/------- [Output tensor] -------/");
            Console.WriteLine("Output tensor type: {0}", output_tensor.get_element_type().to_string());
            Console.WriteLine("Output tensor shape: {0}", output_tensor.get_shape().to_string());
            Console.WriteLine("Output tensor size: {0}", output_tensor.get_size());
            // 获取输出数据
            float[] result = output_tensor.get_data(1000);
            List new_list = new List { };
            for (int i = 0; i < result.Length; i++)
            {
                new_list.Add(new float[] { (float)result[i], i });
            }
            new_list.Sort((a, b) => b[0].CompareTo(a[0]));


            KeyValuePair[] cls = new KeyValuePair[10];
            for (int i = 0; i < 10; ++i)
            {
                cls[i] = new KeyValuePair((int)new_list[i][1], new_list[i][0]);
            }
            Console.WriteLine("
 Classification Top 10 result : 
");
            Console.WriteLine("classid probability");
            Console.WriteLine("------- -----------");
            for (int i = 0; i < 10; ++i)
            {
                Console.WriteLine("{0}     {1}", cls[i].Key.ToString("0"), cls[i].Value.ToString("0.000000"));
            }
            // 销毁非托管内存
            output_tensor.dispose();
            input_shape.dispose();
            infer_request.dispose();
            compiled_model.dispose();
            input.dispose();
            output.dispose();
            model.dispose();
            core.dispose();


        }
    }
}

 

向右滑动查看完整代码

1.12总结

在本文中我们基于模型推理流程,演示了 OpenVINOSharp API 使用方法,并和 OpenVINO C++API 进行了对比,展示了 OpenVINOSharp API 与 C++API 在使用的区别,这也对使用过 C++ API 的开发者十分友好,上手会十分容易。

在本文中我们只展示了基础的模型推理流程代码,也对各个 API 进行了测试,针对其他比较高级的 API 方法,我们后续会继续进行测试其他 API 方法,向各位开发者展示其用法。

总的来说,目前 OpenVINOSharp 已经完全支持在 Windows 环境下的安装使用,欢迎各位开发者安装使用,如有相关问题或优化方法,也欢迎大家提出意见与指导。

  审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分