人工智能
ADI 公司构建了一个系统 OtoSense,该系统能够从机器学习声音和振动,并破译其含义以检测异常行为并执行诊断。该系统是一个机器健康监测系统,可以实现我们所说的“计算机听力”,它允许计算机理解机器行为的主要指标:声音和振动。
该系统适用于任何机器,无需网络连接即可实时工作。该系统适用于工业应用,可实现可扩展、高效的机器健康监测。
人类听觉系统和 OtoSense 的翻译
人类理解声音的过程可以用四个熟悉的步骤来描述:声音的模拟采集、数字转换、特征提取和解释。在这些步骤中,可以将人耳听力与 OtoSense 系统进行比较。
模拟采集和数字化: 在 OtoSense 中,模拟采集和数字化由传感器、放大器和编解码器执行。数字化过程使用可在 250 Hz 和 196 kHz 之间调整的固定采样率,波形以 16 位编码并存储在 128 个样本到 4096 个样本的缓冲区中。
特征提取: OtoSense 使用我们称为块的时间窗口,它以固定的步长移动。这个块的大小和步长可以从 23 毫秒到 3 秒不等,具体取决于需要识别的事件和采样率,并在边缘提取特征。稍后我们将提供有关 OtoSense 提取的特征的更多信息。
解释发生在关联皮层中: OtoSense 与人的交互从基于人类神经学的视觉、无监督声音映射开始。它显示了所有听到的声音或振动的图形表示,按相似性组织,但不试图创建严格的类别。这允许专家组织和命名屏幕上看到的分组,而无需尝试人为地创建有界类别。他们可以构建与他们对 OtoSense 最终输出的知识、感知和期望相一致的语义图。
从声音和振动到功能
特征被分配一个单独的数字来描述一段时间内的声音或振动的给定属性或质量(如我们前面提到的时间窗口或块)。OtoSense 平台选择功能的原则如下:
特征应 尽可能完整地描述环境,并在频域和时域中提供尽可能多的细节。他们必须描述静止的嗡嗡声以及咔哒声、嘎嘎声、吱吱声和任何类型的瞬态不稳定性。
特征应尽可能正交地构成一个集合。如果一个特征被定义为“块上的平均振幅”,则不应该有另一个特征与其强相关,就像“块上的总光谱能量”这样的特征。当然,永远不会达到正交性,但任何特征都不应该表示为其他特征的组合——每个特征中都必须包含一些奇异的信息。
特征 应该 最小化 计算。大多数 OtoSense 功能都设计为增量式,因此每个新样本都可以通过简单的操作修改功能,而无需在完整缓冲区或更糟糕的块上重新计算它。最小化计算也意味着不关心标准物理单位。例如,尝试用 dBA 值表示强度是没有意义的。如果需要输出一个dBA值,可以在输出的时候做,如果需要的话。
OtoSense 平台的 2 到 1024 功能的一部分描述了时域。它们要么直接从波形中提取,要么从块上任何其他特征的演变中提取。其中一些特征包括平均和最大振幅、从波形的线性长度导出的复杂性、振幅变化、脉冲的存在和表征、作为第一个和最后一个缓冲区之间相似性的稳定性、避免卷积的窄自相关或变化主要光谱峰。
频域上使用的特征是从 FFT 中提取的。FFT 在每个缓冲区上计算并产生 128 到 2048 个单独的频率贡献。然后,该过程会创建一个具有所需维数的向量——当然,远小于 FFT 大小,但这仍然广泛地描述了环境。OtoSense 最初从一种不可知的方法开始,用于在对数谱上创建相等大小的存储桶。然后,根据环境和要识别的事件,这些桶适应于关注信息密度高的频谱区域,无论是从最大化熵的无监督角度,还是从使用标记事件作为一个半监督的角度。指导。这模仿了我们内耳细胞的结构,在语音信息最大的地方更密集。
架构:向边缘供电和本地数据
使用 OtoSense 的异常值检测和事件识别发生在边缘,无需任何远程资产的参与。这种架构确保系统不会受到网络故障的影响,并且避免了将所有原始数据块发送出去进行分析。运行 OtoSense 的边缘设备是一个独立的系统,它实时描述它正在收听的机器的行为。
运行 AI 和 HMI 的 OtoSense 服务器通常托管在本地。云架构对于聚合多个有意义的数据流作为 OtoSense 设备的输出是有意义的。将云托管用于专门处理大量数据并与单个站点上的数百个设备交互的 AI 就没有意义了。
图 1. OtoSense 系统。
从特征到异常检测
正常/异常评估不需要与专家进行太多互动即可开始。专家只需要帮助建立机器正常声音和振动的基线。然后,此基线在被推送到设备之前在 OtoSense 服务器上转换为异常值模型。
两种不同的策略用于评估传入声音或振动的正常性:
第一个策略是我们所说的常态,即任何进入特征空间的新传入声音都会检查其周围环境、它与基线点和集群的距离以及这些集群的大小。距离越大,簇越小,新声音越不寻常,离群值越高。当这个异常值高于专家定义的阈值时,相应的块被标记为异常并发送到服务器以供专家使用。
第二种策略非常简单:任何具有高于或低于定义基线的所有特征的最大值或最小值的特征值的传入块都被标记为极端并发送到服务器。
异常和极端策略的结合提供了对异常声音或振动的良好覆盖,并且这些策略在检测渐进磨损和意外的残酷事件方面表现良好。
从特征到事件识别
特征属于物理领域,意义属于人类认知。要将特征与意义联系起来,需要 OtoSense AI 和人类专家之间的交互。我们花费了大量时间听取客户的反馈来开发人机界面 (HMI),使工程师能够有效地与 OtoSense 交互以设计事件识别模型。该 HMI 允许探索数据、对其进行标记、创建异常模型和声音识别模型以及测试这些模型。
OtoSense Sound Platter(也称为 splatter)允许通过对数据集的完整概览来探索和标记声音。Splatter 在完整的数据集中选择最有趣和最有代表性的声音,并将它们显示为混合标记和未标记声音的 2D 相似度图。
图 2. OtoSense Sound Platter 中声音的 2D 飞溅图。
任何声音或振动,连同其上下文,都可以通过许多不同的方式进行可视化——例如,使用声音小部件(也称为小部件)。
图 3. OtoSense 声音小部件(小部件)。
在任何时候,都可以创建异常值模型或事件识别模型。事件识别模型以圆形混淆矩阵的形式呈现,允许 OtoSense 用户探索混淆事件。
图 4.可以根据所需事件创建事件识别模型。
可以通过一个界面来探索和标记异常值,该界面会随着时间的推移显示所有不寻常和极端的声音。
图 5. OtoSense 异常值可视化中随时间推移的声音分析。
持续学习过程,从异常检测到日益复杂的诊断
OtoSense 旨在向多位专家学习,并允许随着时间的推移进行越来越复杂的诊断。通常的过程是 OtoSense 和专家之间的循环循环:
异常值模型和事件识别模型在边缘运行。这些为潜在事件发生的概率以及它们的异常值创建了输出。
超过定义阈值的异常声音或振动会触发异常通知。然后,使用 OtoSense 的技术人员和工程师可以检查声音及其上下文。
然后,这些专家将这一不寻常的事件标记为。
计算包含此新信息的新识别模型和异常值模型并将其推送到边缘设备。
结论
ADI 公司的 OtoSense 技术的目标是持续提供声音和振动专业知识。该技术在航空航天、汽车和工业监控应用中用于机器健康监测,在曾经需要人类专业知识的情况下以及在涉及嵌入式应用的情况下(尤其是在复杂机器上)显示出性能。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !