“异常值(又名异常)是数据集中的观察结果,它似乎与该数据集的其余部分不一致”——约翰逊 1992 年
“离群值是一种观察结果,它与其他观察结果的偏差如此之大,以至于引起人们怀疑它是由不同的机制产生的”——霍金斯 1980
异常是与常态不同、很少发生并且不符合“模式”其余部分的事件。异常包括,例如:
一级图像处理方法
基于传统的图像处理技术,例如边缘检测、特征检测……和测量指标(例如,大小、颜色、位置、周长、圆度、形状……)来描述一个物体 。
优点:无需培训
缺点:没有概括性
二级机器学习方法
机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预先确定的方程式作为模型。
优点:更少的培训
缺点:泛化程度较低
3 级深度学习方法
基于卷积神经网络检测异常值。训练和推理需要大数据集和高效的硬件
优点:更泛化
缺点:更多培训
小伙伴可能会问“我们应该选择哪种方法呢?” 即使我们的问题与上面的情况完全不同也不必担心,我们提供一个选择的原则:
异常检测将如何在三种不同的情况下发生,具体取决于数据的情况。
监督:
在这种情况下,训练数据被标记为“好”或“异常”(坏)。监督场景是理想的。这是为数据科学家精心准备的数据集,其中所有数据点都标记为异常或良好的情况。
资源用于结构化数据的流行 ML/DL 算法:
半监督:
在半监督场景中,所有数据都被假定为“好”,并且被“异常”(坏)数据点污染。
用于结构化数据的流行 ML/DL 算法:
无监督:
在无监督场景中,训练数据是未标记的,由“好”和“异常”(坏)数据点组成。无监督场景中的数据集没有将其部分标记为好或坏。
“无监督学习中最常见的任务是聚类、表示学习和密度估计。在所有这些情况下,我们都希望在不使用明确提供的标签的情况下了解数据的固有结构。”
在无监督场景中,需要一组不同的工具来在非结构化数据中创建顺序。非结构化数据的流行 ML/DL 算法是:
App1:使用机器学习技术对无人机进行实时退化识别(Real time degradation identification of UAV using machine learning techniques)
在本文中,作者分析了无人机执行预定任务后的飞行数据流,并实时预测身体部位(在本例中为螺旋桨)的退化程度。
为了实现这一目标,他们使用 k 最近邻算法作为分类算法,并使用动态时间规整作为距离度量来计算两个航班块之间的相似性。
App2:UAV-AdNet:使用深度神经网络进行空中监视的无监督异常检测(
UAV-AdNet: Unsupervised Anomaly Detection using Deep Neural Networks for Aerial Surveillance)
在本文中,作者提出了一种用于鸟瞰图像环境表示的启发式方法和一种基于 DNN 的异常检测方法 (UAV-AdNet),该方法在环境表示和 GPS 标签上联合训练。
在他们的实验中,他们证明了所提出的架构在输入的复制和裁剪连接下具有更好的场景重建性能。他们还观察到,为网络提供 GPS 数据可以增强异常检测性能。
在他们的研究中,作者考虑了以下异常情况:
(1) 违反私人规则的物体:建筑物背面出现任何人或车辆。建筑物左侧出现任何车辆
(2)违反公共规则的物体:行人只能使用斑马线过马路。自行车只能在自行车道上行驶。除自行车和摩托车外,其他车辆不得在自行车道上骑行或停放。
(3)寻找可疑物品
App3:监控环境中无人机录制的视频中的异常检测(Anomaly Detection in Videos Recorded by Drones in a Surveillance Context)
本文专门研究了监视环境中的异常检测,特别是针对由无人机录制的监视视频组成的微型无人机视频数据集。本文提出的模型在 MDV 数据集上进行了评估。
尽管它很简单,但该模型达到了最先进的性能。获得的结果表明,这种应用程序的监督学习不太适合异常检测。因为该模型未能检测到它在 MDV 数据集训练期间从未遇到过的情况,这是有问题的,因为即使不是不可能,也很难编译代表许多实例的所有可能异常的数据集。
建议的异常检测器是由卷积神经网络和递归神经网络组成的深度神经网络,使用监督学习进行训练。在他们未来的工作中,他们将专门检查使用无监督学习训练的模型设计,以减少对标记异常数据的需求。
App4:使用航空红外热成像技术自动检测光伏电站:综述(Automatic Inspection of Photovoltaic Power Plants Using Aerial Infrared Thermography: A Review)
提出一种使用空中红外视频进行自动光伏电站检查的有效方法。
本文对光伏电站航空红外热成像 (aIRT) 框架不同任务自动化方法的文献进行了全面回顾,因为这是近年来研究人员深入研究的课题。这些研究大多集中在视觉、IRT 和 aIRT 图像中光伏电站的自主故障检测和分类。在这些研究中,DL 算法的使用提供了良好的结果,在从 aIRT 图像中提取的模块段中检测到的 10 种不同异常类型的故障检测和分类中,准确率高达 90%。
然而,所开发算法的准确性、鲁棒性和泛化性仍然是这些研究的主要挑战,尤其是在处理更多类别的故障和大型光伏电站的检查时。随着公用事业规模光伏电站的容量和规模不断增加,达到千兆瓦和数百公顷的规模,自动化越来越成为一个不仅具有科学意义而且具有经济重要性的问题。因此,仍然必须探索自主程序和分类任务,以提高 aIRT 方法的准确性和适用性。
全部0条评论
快来发表一下你的评论吧 !