如何应用Anomalib在数据集不平衡的情况下检测缺陷?

描述

当您想进行自动缺陷检测,但数据集不平衡时,Anomalib 是一个很好的工具。

在这个示例中,我们将介绍一个令人振奋的 Dobot 机器人工业用例,其中的机械臂用于教育、工业和智能用例中。如果您没有可用的 Dobot 机器人,您可以简单地修改 notebook,避开、注释或改变机器人代码,使其为您所用。

让我们开始吧

为了解 Anomalib 的工作原理,我们将看一个检查彩色立方体的生产线。其中一些立方体会有洞或缺陷,需要从传送带上取下。由于这些缺陷在生产线上并不常见,我们将为我们的 AI 模型拍摄一些图像。

安装:

按照以下步骤使用源文件安装 Anomalib:

1.使用 Python 3.8 版本创建运行 Anomalib + Dobot DLL 的环境

对于 Windows,使用以下代码:

python -m venv anomalib_env 

anomalib_envScriptsactivate

对于 Ubuntu:

python3 -m venv anomalib_env 

source anomalib_env/bin/activate

2.从 GitHub 存储库中安装 Anomalib 及 OpenVINO 要求(在这篇博文中,我们将不使用 pip 安装命令):

python –m pip install –upgrade pip wheel setuptools 

cd anomalib 

pip install -e . [openvino] 

3.安装 Jupyter Lab 或 Jupyter Notebook:

pip install notebook 

pip install ipywidgets 

4.然后连接您的 USB 摄像头,使用简单的摄像头应用验证它在正常工作。然后,关闭该应用。

可选:如果您可以访问 Dobot,请实施以下步骤:

1.安装 Dobot 要求。

2.检查 Dobot 的所有连接状态,并使用 Dobot Studio 验证它在正常工作。

3.将通风配件安装在 Dobot 上,并使用 Dobot Studio 验证它在正常工作。

4.在 Dobot Studio(图 2)中,点击“Home”按钮,找到:

校准坐标:立方体阵列的左上角初始位置。

位置坐标:机械臂应将立方体放在传送带上方的位置。

异常坐标:释放异常立方体的位置。

然后在 notebook 中替换这些坐标。

5.如需使用机器人运行 notebook,从这里下载 Dobot API 和驱动程序文件,并将它们添加到存储库 Anomalib 文件夹的 notebooks/500_uses_cases/dobot 中。

python

|图 2:Dobot Studio 界面。

注:如果没有机器人,您可以转到另一个 notebook,如 501b notebook,通过这个链接下载数据集,并在那里尝试训练和推理。

01

Notebook 的数据采集和推理

下面,我们需要使用正常的数据集创建文件夹。在这个示例中,我们创建了一个彩色立方体的数据集,并为异常情况添加一个黑色圆圈贴纸,以模拟盒子上的洞或缺陷(图 3)。对于数据采集和推理,我们将使用 501a notebook。

python

|图 3:用于第一轮训练的数据集。

在采集数据时,请务必将 acquisition 变量设置 为 True  来运行notebook,并为没有异常的数据定义“正常”文件夹,为异常图像定义“异常”文件夹。数据集将直接在 Anomalib 克隆的文件夹中创建,所以我们将看到 Anomalib/dataset/cubes 文件夹。

如果您没有机器人,您可以修改代码以保存图像或使用下载的数据集进行训练。

推理:

对于推理,acquisition 变量应该是 False,我们不会保存任何图像。我们将读取采集到的视频帧,使用 OpenVINO 运行推理,并决定放置立方体的位置:对于正常立方体,放置在传送带上;对于异常立方体,放置在传送带外。

我们需要识别采集标记 — 采集模式为 True,推理模式为 False。在采集模式下,要注意是创建正常还是异常文件夹。例如,在采集模式下,notebook 会将每张图像保存在 anomalib/datasets/cubes/{FOLDER} 中,以便进一步训练。在推理模式下,notebook 不会保存图像;它将运行推理并显示结果。

训练:

对于训练,我们将使用 501b notebook。在这个 notebook 中,我们将使用 PyTorch Lighting,并使用“Padim”模型进行训练。这种模型有几个优点:我们不需要 GPU,只用 CPU 就可以完成训练过程,而且训练速度也很快。

现在,让我们深入了解一下训练 notebook! 

02

导入

在这一部分,我们将解释用于该示例的软件包。我们还将从 Anomalib 库中调用需要使用的软件包。

配置:

有两种方法来配置 Anomalib 模块,一种是使用配置文件,另一种是使用 API。最简单的方法是通过 API 查看该库的功能。如果您希望在您的生产系统中实施 Anomalib,请使用配置文件 YAML 文件,它是核心训练与测试进程,包含数据集、模型、试验和回调管理(图 4)。

在接下来的部分,我们将描述如何使用 API 配置您的训练。

python

|图 4:训练和验证模块。

数据集管理器:

通过 API,我们可以修改数据集模块。我们将准备数据集路径、格式、图像大小、批量大小和任务类型。然后,我们使用以下代码将数据加载到管道中。

i, data = next(enumerate(datamodule.val_dataloader()))

模型管理器:

对于异常检测模型,我们使用 Padim,您也可以使用其他 Anomalib 模型,如:CFlow、CS-Flow、DFKDE、DFM、DRAEM、FastFlow、Ganomaly Patchcore、Reverse Distillation 和 STFPM。此外,我们使用 API 设置了模型管理器;使用 anomalib.models 导入 Padim。

回调(Callbacks)管理器:

为了适当地训练模型,我们需要添加一些其他的“非基础”逻辑,如保存权重、尽早终止、以异常分数为基准以及将输入/输出图像可视化。为了实现这些,我们使用回调Callbacks。Anomalib 有自己的Callbacks,并支持 PyTorch Lightning 的本地callbacks。通过该代码,我们将创建在训练期间执行的回调列表。

训练:

在设置数据模块、模型和callbacks之后,我们可以训练模型了。训练模型所需的最后一个组件是 pytorch_lightning Trainer 对象,它可处理训练、测试和预测管道。复制链接,查看 notebook 中的 Trainer 对象示例。

验证:

我们使用 OpenVINO 推理进行验证。在之前的导入部分,我们导入了 anomalib.deploy 模块中的 OpenVINOInferencer。现在,我们将用它来运行推理并检查结果。首先,我们需要检查 OpenVINO 模型是否在结果文件夹中。

预测结果:

为了实施推理,我们需要从 OpenVINOinference(我们可在其中设置 OpenVINO 模型及其元数据)中调用 predict 方法,并确定需要使用的设备:

predictions = inferencer.predict(image=image)

预测包含与结果有关的各种信息:原始图像、预测分数、异常图、热图图像、预测掩码和分割结果(图 5)。根据您要选择的任务类型,您可能需要更多信息。

python

|图 5:预测结果

最后,我们采用 Dobot 机器人的缺陷检测用例基本是这样的。

03

使用您自己的数据集的技巧和建议

数据集转换:

如果您想提高模型的准确性,您可以在您的训练管道中应用数据转换。您应该在 config.yaml 的 dataset.transform_config 部分提供增强配置文件的路径。这意味着您需要有一个用于 Anomalib 设置的 config.yaml 文件,以及一个可供 Anomalib config yaml 文件使用的单独 albumentations_config.yaml 文件。

强大的模型:

异常检测库并非无所不能,在碰到麻烦的数据集时也可能会失效。好消息是:您可以尝试 13 个不同的模型,并能对每个实验的结果进行基准测试。您可以将基准测试入口点脚本用于其中,并将配置文件用于基准测试目的。这将帮助您为实际用例选择最佳模型。






审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分