大象是在地球表面漫游的最大的陆地哺乳动物,它们有着独特的巨大身体、耳朵和长长的树干。在我的祖国斯里兰卡,大象具有象征意义、文化意义和经济意义,在宗教活动中具有特殊意义。可悲的是,许多问题正在威胁大象种群。根据世界自然基金会的说法,对非洲象的最大威胁是野生犯罪,而对亚洲象的最大威胁是栖息地丧失,从而导致大象-人类冲突。由于栖息地不断缩小,亚洲象现在被 IUCN(国际自然保护联盟)列为“濒危物种”。
偷猎和人象冲突是一些最具威胁性的问题,因此监控它们可以帮助我们防止对大象造成危险。大象的听力很差,可以用低于人类听觉频率范围的低频声音进行交流。
他们有不同类型的叫声——例如喉音、躯干、模仿和新奇的叫声——它们在某些情况下表现出攻击性、惊吓、威胁等。人类可能无法区分这些叫声并预测当时的情况。大象目前就是这样,但是一个准确的机器学习模型有能力。
我决定使用 Edge Impulse 工作室构建一个机器学习模型,并利用我在Elephant Voices 数据库的帮助下创建的数据集。我在我的机器学习模型中使用了与群体防御、必须行为和冲突相关的调用。
ML 模型可以部署为大象项圈中的音频分类模型,供特定保护区甚至森林中的大象佩戴。该设备不需要任何互联网连接,并且以最小的功耗运行。
继续阅读以了解有关此项目的更多信息。我的最终和完整的想法在最后一节中提出。
大象通常成群结队,通常互相照顾并保护自己免受威胁。
根据 Elephant Voices 的说法,与反捕食者行为相关的呼叫包括用于提醒同伴注意捕食者存在、恐吓或“围攻”捕食者的呼叫,以及在采取防御行动时使用的呼叫。当家庭成员面对掠食者或发现自己处于潜在的威胁或可怕情况时,他们会产生几种不同的呼叫类型。这些包括隆隆声、鼻息声、喇叭声和咆哮声。关于大象在捕食者面前复杂且高度协调的防御和进攻行为的文章很多,但产生的各种叫声以及其他大象对这些叫声的戏剧性反应却很少受到关注。
当暴露在狮子、鬣狗、人类或其他潜在危险的捕食者或情况下的声音、视觉和气味时,雌性和小牛通常会首先冻结,然后快速组装(快速行走或跑向彼此),然后聚集在一起。一旦大象评估了所呈现的危险程度,它们可能会攻击集体或仓促撤退。他们的特殊反应似乎部分是通过微调的声音信号传达的。
我们可以使用 Edge Impulse 来识别某些呼叫,并帮助我们了解戴着项圈的大象目前所面临的情况。
Mustth 是雄性大象的一种正常周期性状况,其特征是具有高度攻击性的行为,并伴有生殖激素的大量升高。雄性个体在每年的特定时间进入高峰期,它们在此期间的活动极大地影响了大象社会以及人象互动。它们可能很危险,我们必须在它们经历这种情况时对其进行监控。
使用 RFID 微芯片和同步 RFID 阅读器,我们可以计算出大象距离风险区域的距离。使用超高频天线有助于扩大 RFID 微芯片的检测范围。通过计算距离,我们可以预测大象是否正在接近该区域。我们还可以监控其行为,以评估与此冲突相关的风险。一旦检测到接近的大象,就可以通过打开信标灯来提醒居住在该区域的人们。
根据大象之声的说法,在食物、水和矿物质丰富且分布相对均匀的栖息地,大象不太可能因资源冲突而发生冲突,但在相反的情况下,大象之间的冲突可能会很激烈,与争斗行为相关的发声更多经常。此外,随着人口的增加,许多大象必须与人类和牲畜以及其他大象争夺资源。
资源的缺乏或减少只是冲突的来源之一。雄性相互威胁,甚至可能会为了必须的地位和接近接受性的雌性而战斗至死。年轻的雄性进行陪练比赛以获取经验并测试彼此的力量,这种俏皮的格斗有时会变得具有攻击性。与成年女性体型相同的十几岁男性开始四处移动,了解到他们可以挑选比自己年长但比自己小的女性。这种行为是不能容忍的,可能会引起女族长或女性联盟的攻击性攻击。
由于对资源的竞争,人象冲突已经发展成为一个巨大的问题,对日益减少的大象种群构成威胁。这也是斯里兰卡农村地区最大的环境和社会经济危机之一。大象 - 随着越来越多的大象与人类密切接触,人类冲突正在加剧。这通常会导致大象毁坏庄稼和财产,偶尔还会造成人员伤亡。这些负面互动可能导致大象遭到报复性攻击/杀害。
在 2019 年的前 10 个月,93 人和 293 头大象已经在这场冲突中丧生,相比之下,斯里兰卡 2018 年全年有 96 人和 319 头大象死亡。这种情况正在增加,政府正在研究不同类型的解决方案来防止这个问题。
监测大象的行为和叫声可以帮助我们预测这种冲突并拯救这两个物种。借助准确的机器学习模型,我们可以成功地预测冲突并提醒处于危险区域的人类。该系统也可以自动化,一旦预测到冲突,就可以打开信标灯。
在这个项目中,我们将使用 Edge Impulse 工作室来构建机器学习模型,我们可以使用Elephant Voices 数据库创建数据集。
为了使这个项目更容易,请遵循Edge Impulse 的关于从音频中识别声音的指南。
我没有使用任何设备来捕获数据。相反,我使用来自Elephant Voices 数据库的声音创建了一个数据集。我使用了来自 Group Defense、Male-Male Competition(Musth 条件期间)和 Conflict 的声音。我从 YouTube 下载了 Jungle 和 Savannah 的声音,并将其归入“Noise”标签。
我在四个标签下创建了一个数据集:Conflict、Group Defense、Musth 和 Noise。
创建训练数据集后,我设计了一个脉冲。脉冲获取原始数据,在较小的窗口中对其进行切片,使用信号处理模块提取特征,然后使用学习模块对新数据进行分类。信号处理模块总是为相同的输入返回相同的值,用于使原始数据更易于处理,而学习模块则从过去的经验中学习。
对于这个项目,我们将使用“MFCC”信号处理块,它使用梅尔频率倒谱系数从音频信号中提取特征,非常适合人声。
然后将这个简化的音频数据传递给神经网络模块,该模块将从数据中学习模式,并将这些应用于新数据并对其进行分类。这非常适合对运动进行分类或识别音频。
配置过程中不要更改默认参数。
向下滚动并单击“保存参数”。这会将您重定向到“生成功能”页面。
单击“生成功能”并向下滚动。你会看到类似这样的东西:
Creating job... OK (ID: 314642)
Job started
Creating windows from 69 files...
[ 0/69] Creating windows from files...
[ 1/69] Creating windows from files...
[ 1/69] Creating windows from files...
[13/69] Creating windows from files...
[43/69] Creating windows from files...
[69/69] Creating windows from files...
Created 1677 windows: Conflict: 127, Group Defense: 663, Musth: 62, Noise: 825
Scheduling job in cluster...
Job started
Creating features
[ 1/1677] Creating features...
[ 696/1677] Creating features...
[1391/1677] Creating features...
[1677/1677] Creating features...
Created features
Scheduling job in cluster...
Job started
Reducing dimensions for visualizations...
UMAP(a=None, angular_rp_forest=False, b=None,
force_approximation_algorithm=False, init='spectral',
learning_rate=1.0,
local_connectivity=1.0, low_memory=False,
metric='euclidean',
metric_kwds=None, min_dist=0.1, n_components=3,
n_epochs=None,
n_neighbors=15, negative_sample_rate=5,
output_metric='euclidean',
output_metric_kwds=None, random_state=None,
repulsion_strength=1.0,
set_op_mix_ratio=1.0, spread=1.0,
target_metric='categorical',
target_metric_kwds=None, target_n_neighbors=-1,
target_weight=0.5,
transform_queue_size=4.0, transform_seed=42, unique=False,
verbose=True)
Construct fuzzy simplicial set
Sun Oct 18 01:29:25 2020 Finding Nearest Neighbors
Sun Oct 18 01:29:27 2020 Finished Nearest Neighbor
Search Still running...
Sun Oct 18 01:29:30 2020
Construct embedding
completed 0 / 500 epochs
completed 50 / 500 epochs
completed 100 / 500 epochs
Still running...
completed 150 / 500 epochs
completed 200 / 500 epochs
completed 250 / 500 epochs
completed 300 / 500 epochs
completed 350 / 500 epochs
completed 400 / 500 epochs
completed 450 / 500 epochs
Sun Oct 18 01:29:37 2020 Finished embedding
Reducing dimensions for visualizations OK
Job completed
现在,是时候开始训练神经网络了。神经网络是一种算法,松散地模仿人脑,可以学习识别出现在训练数据中的模式。我们在这里训练的网络将 MFCC 作为输入,并尝试将其映射到四个类别之一——冲突、群体防御、musth 和噪声。
我不得不用不同的选项训练我的模型大约 3 次。当训练周期数为 100 时,我的第一次试验给了我 65.2% 的准确率。我使用了 2D 卷积架构预设。我重新训练了我的模型,这一次,我将训练周期数增加到 300。我得到了 67.3% 的准确率。
最后,当我用 300 个训练周期和默认架构预设重新训练我的音频分类模型时,我得到了 76.5% 的准确率。
可以通过获取更多数据来提高此机器学习模型的准确性,并且每个标签至少需要 10 分钟的数据。
您可以通过此模型测试来测试模型的有效性。我测试了 13 个样本,我的模型只识别了一个。如果每个标签下都有更多数据,这个 ML 模型会更准确。
ML 模型现在可以部署了。这使得模型在没有互联网连接的情况下运行,最大限度地减少延迟,并以最低的功耗运行。您可以为开发板创建库或构建固件。
我已经将我的音频分类模型变成了可以在任何设备上运行的优化源代码,例如:STMicroelectronics MP23ABS1 。
该设备可以连接到大象项圈并实施以防止对减少的大象种群的危险和威胁。
为了让事情变得更有趣和更有效,可以在大象项圈上安装一个 RFID 微芯片,或者可以将一个无源 RFID 标签贴在大象的耳朵上。每头大象都有一个唯一的 ID,在超高频天线和Sparkfun 的同步 RFID 阅读器的帮助下,我们将能够检测到大象何时在远离偷猎风险区域或人们居住的地方的安全距离内。同步 RFID 阅读器能够同时读取多个标签。如果大象靠近,RFID阅读器将能够检测到,因为它可以计算出某个RFID标签和阅读器之间的距离。如果大象处于危险之中,公园或护林员可以采取适当的行动。
RFID 阅读器可以在距离人们居住或偷猎活动频繁的区域约 1 或 2 公里处连接到微控制器。如果系统检测到大象接近,微控制器会被编程为自动打开信标灯并提醒居住在该区域的人们。
如果机器学习模型无法从项圈中的麦克风记录的音频中识别声音,或者大象项圈的电池电量耗尽或出现故障,这也会很有帮助。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !