助盲环境感知装置设计方案

描述

今天为大家带来的是来自创作者X同学的作品:助盲环境感知装置. 这个装置主要利用Grove Vision AI V2-Camera module识别环境中的物体,并利用XIAO ESP32S3和树莓派进行语音输出,结合了物体检测和文本转语音技术,以向视障人士提供环境信息。

故事背景

视障人士在感知环境和进行导航时面临困难,导致他们的行动能力受到限制。通过这个项目,我将展示如何利用人工智能和计算机视觉技术来应对这一挑战。实施该项目后,盲人可以在一定程度上减少对周围环境和他人的依赖。

该项目结合了物体检测和文本转语音技术,以向视障人士提供环境信息。用户可以通过耳机收听转化后的语音,从而更好地理解周围的世界。  

材料清单

硬件

Seeed Studio XIAO ESP32S3 Sense

Rasberry Pi 1 Model B+

树莓派外壳

Grove -Vision Al Module V2

OV5647-69.1 FOV Camera module for Raspberry Pi 3B+4B

应用软件

SenseCraft AI

Arduino IDE

使用SenseCraft AI 开发物体检测模型

我使用 SenseCraft AI 来训练物体检测模型。SenseCraft AI 是进行模型训练和模型部署的领先开发平台。

要启动一个项目,您需要在 SenseCraft AI 输入您的账户(或创建一个免费账户)。然后就可以使用平台上提供的模型或者创建自己的模型了,这十分便捷。

在 SenseCraft AI 中,您可以上传现有的数据,也可以使用连接设备记录新数据。在我的项目中,我准备了一个数据集,其中包括一些常见物品,如椅子、桌子和路上的行人。数据集中包含的物品越多,模型就越有效。数据集的大小也很重要。我们能拍摄到的特定物体的图像越多,准确度就越高。

我在最初的项目中上传了 3 个物体的 312 张图片。以后我会上传更多对象的更多图像,调高模型的准确度。

将物品鉴别模型上传到Grove Vision AI

打开SenseCraft平台:Home - SenseCraft AI

打开SenseCraft主页,找到模型训练选项,点击进入

在模型训练界面首先选择分类识别类型,然后在”2”处选择设备Grove -Vision Al Module V2 点击连接,接着按照具体需求是否添加类别,并为分类命名

接着在第二步处选择设备Grove -Vision Al Module V2,点击开始训练,高级设置按需设置,否则默认即可,训练完毕后即可选择设备Grove -Vision Al Module V2进行模型部署。等待部署完成,我们在页面右侧即可观察到,通过摄像头对准物品,效果预览内的物体置信度也会实时改变。此步实现及说明模型部署成功。

树莓派

使用XIAO ESP32S3通过串口输出识别物体

将XIAO ESP32S3与 上传好模型的Grove -Vision Al Module V2连接。以下是输出识别物体序号的完整程序,请为 XIAO ESP32 系列编译并上传此程序

 

#include 


SSCMA AI;


void setup()
{
  AI.begin();
  Serial.begin(600);
}


void loop()
{
  if (!AI.invoke())
  {
    Serial.println("invoke success");
    Serial.printf("perf: prepocess=%d, inference=%d, postprocess=%d
",
           AI.perf().prepocess, AI.perf().inference,
           AI.perf().postprocess);
    for (int i = 0; i < AI.boxes().size(); i++)
    {
      Serial.printf(
        "box %d: x=%d, y=%d, w=%d, h=%d, score=%d, target=%d
", i,
        AI.boxes()[i].x, AI.boxes()[i].y, AI.boxes()[i].w,
        AI.boxes()[i].h, AI.boxes()[i].score, AI.boxes()[i].target);
    }
    for (int i = 0; i < AI.classes().size(); i++)
    {
      Serial.printf("class %d: target=%d, score=%d
", i,
             AI.classes()[i].target, AI.classes()[i].score);
             delay(2000);
    }
    for (int i = 0; i < AI.points().size(); i++)0
    {
      Serial.printf("point %d: x=%d, y=%d, z=%d, score=%d, target=%d
",
             i, AI.points()[i].x, AI.points()[i].y,
             AI.points()[i].z, AI.points()[i].score,
             AI.points()[i].target);
    }
  }
}

 

输出结果:

当我将摄像头对准人时,串口输出target1代表识别到人

树莓派

当我将摄像头对准桌子时,串口输出target2代表识别到桌子

树莓派

当我将摄像头对准椅子时,串口输出target0代表识别到椅子

树莓派

配置树莓派

XIAO ESP32S3 Sense搭配Grove -Vision Al Module V2 可检测周围环境中的物体,并返回物体的名称和位置。Raspberry Pi 用于通过 UART 接收物体名称和位置,并将文本转换为语音。在这里使用的是 Raspberry Pi 4 B,性能令人满意。在 Raspberry Pi 上安装操作系统后,我配置了音频控制系统,并将音量设置为 100%。

 

sudo raspi-config

 

树莓派

然后,我在 Pi 上安装了免费的软件包 Festival。Festival 由英国语音技术研究中心编写,为构建语音合成系统提供了一个框架。它通过多种应用程序接口提供完整的文本到语音功能:从 shell 层、通过命令解释器、作为 C++ 库、从 Java 和 Emacs 编辑器界面。

使用以下命令安装 festival:

 

sudo apt-get install -y libasound2-plugins festival
 

 

树莓派

安装festival后,连接了一个有线耳机,并使用以下音频进行了测试

 

echo "Hello World!" | festival --tts

 

然后,在 Raspberry Pi 上安装了 python 串行模块。

树莓派

通过一根 USB-C 电缆将 XIAO ESP32S3 Sense 与 Raspberry Pi 连接起来。

为树莓派编写代码

在编写代码之前,我们需要知道 XIAO Sense 板的串口号。

连接好 XIAO Sense 板并将其插入 Raspberry Pi 后,我们可以在终端运行以下命令。

 

dmesg | grep tty

 

结果是:

树莓派

现在我们知道串行端口号了。是时候编写代码了。我为 Raspberry Pi 编写了以下代码,将接收到的文本转换为语音

 

#!/usr/bin/env python
# 这行指定脚本使用的解释器(Python)
import time
import serial
import os
# 设置串口连接的参数,用于与设备进行通信
ser = serial.Serial(
        port='/dev/ttyACM1', # 指定设备连接的端口。
        baudrate = 115200, # 设置串口通信的波特率
        parity=serial.PARITY_NONE, # 不使用奇偶校验位
        stopbits=serial.STOPBITS_ONE, # 使用一个停止位
        bytesize=serial.EIGHTBITS, # 每个字节有8位数据位
        timeout=1 # 设置读取串口时的超时时间为1秒
)
# 进入一个无限循环,不断读取串口数据
while True:
        receive_msg=ser.readline()  # 从串口读取一行数据
        print(receive_msg)           # 打印接收到的数据
# 如果接收到的数据中包含“basin”的字样,则执行以下操作:
        if b'basin' in receive_msg.lower():
            os.system('echo "basin in front" | festival --tts')# 使用festival语音合成引擎朗读提示信息。
# 如果接收到的数据中包含“1”的字样,则执行以下操作:
        if b'1' in receive_msg.lower():
            os.system('echo "people in front" | festival --tts')
# 如果接收到的数据中包含“0”的字样,则执行以下操作:
        if b'0' in receive_msg.lower():
            os.system('echo "chair in front" | festival --tts')
# 如果接收到的数据中包含“2”的字样,则执行以下操作:
        if b'2' in receive_msg.lower():
            os.system('echo " table in front" | festival --tts')
//以此类推

 

测试结果:

树莓派

树莓派

脚本设置开机自动启动

bashrc 配置

修改 .bashrc 文件。

 

sudo nano /home/pi/.bashrc
在 /home/pi/.bashrc 文件的末尾添加启动命令文本。

 

 

echo Running at boot 
sudo python /home/pi/sample.py
 

 

上面的 echo 命令用于显示 .bashrc 文件中的脚本已经开始运行。

Bash RC 配置程序会在树莓派启动时自动运行。.bashrc 文件中的命令在运行时会打开一个新的终端窗口。

但是当我在配置好以上内容时,出现如下报错:

树莓派

解决办法:
对我来说,我必须添加创建文件 /etc/asound.conf

并在此文件中并添加此内容:

 

pcm.!default {
type asym
playback.pcm {
type plug
slave.pcm "hw:2,0"
}
}

 

这样在树莓派连接电源开机时,此程序就会自动运行啦!

外壳组装

基于Seeed树莓派基础外壳,通过打孔将XIAO ESP32S3与Grove V2安装在壳子外部。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分