如何使用树莓派和Python制作语音控制的冰箱

454398 2019-07-31 2297

电子说

1.3w人已加入

描述

安装Python库和配置音频

在我们运行Python程序之前，我们需要安装两个库：语音识别和PyAudio。要安装这两个库，需要在终端窗口中运行以下两个命令：

$ sudo pip install SpeechRecognition

$ sudo pip install PyAudio

如果您在安装PyAudio时遇到问题，可以使用以下系列安装它说明：

$ sudo apt-get install git

$ sudo git clone http://people.csail.mit.edu/hubert/git/pyaudio.git

$ sudo apt-get install libportaudio0 libportaudio2 libportaudiocpp0 portaudio19-dev

$ sudo apt-get install python-dev

$ cd pyaudio

$ sudo python setup.py install

一旦安装了这两个库，您就需要禁用Raspberry Pi上的板载音频驱动程序，因为它可能会干扰PyAudio。为此，首先打开一个新终端并运行以下命令：

$ cd /etc/modprobe.d

$ sudo nano alsa-blacklist.conf

Nano是终端的简单文本编辑器，加载时只需要输入一行：

blacklist snd_bcm2835

按Ctrl + X退出nano并使用文件名alsa-blacklist.conf保存文件。这个简单的文件禁用了Raspberry Pi的Broadcom音频系统，因此Pi上唯一可用的音频系统是USB声卡。

语音控制冰箱列表如何工作

Python脚本首先导入语音识别模块，该模块用于将口语单词转换为字符串。导入模块后，我们创建一个对象r，它是一个语音识别器对象，用于记录麦克风的音频，然后请求转换。在定义了语音识别对象之后，我们还定义了变量，包括项目列表，命令，当前项目以及包含已解析命令的数组。

import speech_recognition as sr

r = sr.Recognizer（）

items = dict（）

command = “”

item = “”

初始配置完成后，下一个要执行的代码块就是主循环。循环中的第一个任务是通过打印单词“Speak”通知用户发言，然后创建一个名为“audio”的音频对象，它保存我们的麦克风流。

while（1）：

with sr.Microphone（） as source：

print（“Speak：”）

audio = r.listen（source）

当麦克风检测到声音并完成录制时（当声级低于阈值时录制停止），它会将录制的音频传递给识别器对象。执行此操作后，r将使用Google服务尝试将音频转换为句子，然后将其传递给名为speechString的变量。所有这些代码都在try/except块中完成，以防音频被理解或服务不可用。收到的字符串也被解析为prasedCommands，其中分隔符是空格。因此，如果说“添加培根”这个词，结果将是parsedCommands ［0］将是“add”而parsedCommands ［1］将是“bacon”。

try：

speechString =r.recognize_google（audio）

parsedCommands = speechString.split（“ ”）

except sr.UnknownValueError：

print（“Could not understand audio”）

except sr.RequestError as e：

print（“Could not request results; {0}”.format（e））

if（len（parsedCommands）》 0）：

command = parsedCommands［0］

if（len（parsedCommands）》 1）：

item = parsedCommands［1］

现在我们拥有我们解析的命令和项目，我们可以将它们添加到我们的项目列表中。但是，为了保持清洁，我们会执行以下几项检查：

如果该项目已存在且已添加，则增加项目值

如果该项目不存在且添加了该项目，则将该项目添加到列表中

如果该项目已存在且已删除，则如果总计大于1则减去1

/li》

如果该项目已存在，则说明已删除，并且只剩下项目，删除项目

如果该项目不存在，忽略命令

if（command == “add”）：

if item in items：

items［item］ = str（int（items［item］） + 1）

else：

items［item］ = str（1）

print（item + “ added”）

if（command == “remove”）：

if item in items：

if（int（items［item］）》 1）：

items［item］ = str（int（items［item］） - 1）

else：

try：

items.pop（item， None）

except：

pass

print（item + “ removed”）

这个简单脚本中的最后一个命令是“display”，它将变量项的内容打印到显示中。

if（command == “display”）：

print（items）

完整代码

import speech_recognition as sr

r = sr.Recognizer（）

items = dict（）

command = “”

item = “”

while（1）：

with sr.Microphone（） as source：

print（“Speak：”）

audio = r.listen（source）

try：

speechString =r.recognize_google（audio）

parsedCommands = speechString.split（“ ”）

except sr.UnknownValueError：

print（“Could not understand audio”）

except sr.RequestError as e：

print（“Could not request results; {0}”.format（e））

if（len（parsedCommands）》 0）：

command = parsedCommands［0］

if（len（parsedCommands）》 1）：

item = parsedCommands［1］

if（command == “add”）：

if item in items：

items［item］ = str（int（items［item］） + 1）

else：

items［item］ = str（1）

print（item + “ added”）

if（command == “remove”）：

if item in items：

if（int（items［item］）》 1）：

items［item］ = str（int（items［item］） - 1）

else：

try：

items.pop（item， None）

except：

pass

print（item + “ removed”）

if（command == “display”）：

print（items）

command = “”

item = “”

days = “”

parsedCommands.clear（）

此项目以Raspberry Pi为中心，除麦克风和显示器外不需要任何电路或硬件。虽然可以使用普通的显示器或电视显示器，但它对于安装来说并不是很实用，因此在这个项目中，我得到了一个小型的3.5英寸Raspberry Pi显示器，分辨率为480x320。虽然这对于正常使用而言太小，但它非常适合命令行工作，如果通过网络编程和使用此Pi（使用SSH），则可以从任何具有Internet连接的PC上运行Python程序。

打开APP阅读更多精彩内容