用 OpenVINO C++ API 编写 YOLOv8-Seg 实例分割模型推理程序

2023-07-06 09:31 作者:oneAPI技术汇 0人读过 | 我要投稿

1.1

简介

本文章将介绍使用 OpenVINO™ 2023.0 C++ API 开发YOLOv8-Seg 实例分割(Instance Segmentation)模型的AI推理程序。本文 C++ 范例程序的开发环境是 Windows + Visual Studio Community 2022，请读者先配置基于 Visual Studio的OpenVINO C++ 开发环境。

请克隆本文的代码仓：git clone https://gitee.com/ppov-nuc/yolov8_openvino_cpp.git

1.2

导出 YOLOv8-Seg OpenVINO IR 模型

YOLOv8是 Ultralytics 公司基于 YOLO 框架，发布的一款面向物体检测与跟踪、实例分割、图像分类和姿态估计任务的 SOTA 模型工具套件。

首先用命令pip install -r requirements.txt 安装ultralytics 和 openvino-dev。

然后使用命令：yolo export model=yolov8n-seg.pt format=openvino half=True，导出FP16精度的 OpenVINO IR 模型，如下图所示。

接着使用命令：benchmark_app -m yolov8n-seg.xml -d GPU.1，获得yolov8n-seg.xml 模型在 A770m 独立显卡上的异步推理计算性能，如下图所示。

1.3

使用 OpenVINO C++ API 编写 YOLOv8-Seg 实例分割模型推理程序

使用 OpenVINO C++ API 编写 YOLOv8-Seg 实例分割模型推理程序主要有5个典型步骤：

1. 采集图像&图像解码

2. 图像数据预处理

3. AI推理计算(基于 OpenVINO C++ API)

4. 对推理结果进行后处理

5. 将处理后的结果可视化

YOLOv8-Seg 实例分割模型推理程序的图像数据预处理和AI推理计算的实现方式跟 YOLOv8 目标检测模型推理程序的实现方式几乎一模一样，可以直接复用。

1.3.1 图像数据预处理

使用 Netron 打开 yolov8n-seg.onnx，如下图所示，可以看到：

输入节点的名字：“images”；数据：float32[1,3,640,640]
输出节点1的名字：“output0”；数据：float32[1,116,8400]。其中116的前84个字段跟 YOLOv8目标检测模型输出定义完全一致，即cx,cy,w,h和80类的分数；后32个字段为掩膜置信度，用于计算掩膜数据。
输出节点2的名字：“output1”；数据：float32[1,32,160,160]。output0后32个字段与output1的数据做矩阵乘法后得到的结果，即为对应目标的掩膜数据

图像数据预处理的目标就是将任意尺寸的图像数据转变为形状为[1,3,640,640]，精度为 FP32的张量。YOLOv8-Seg 模型的输入尺寸为正方形，为了解决将任意尺寸数据放缩为正方形带来的图像失真问题，在图像放缩前，采用 letterbox 算法先保持图像的长宽比，如下图所示，然后再使用 cv::dnn::blobFromImage 函数对图像进行放缩。