像大多数改造项目一样,这个项目从一些旧的电子设备开始,准确地说,是 Telefunken 的 Bjazzo Ts,在 1960 年代的某个时间在西德制造。
首先是确定什么是可重用的。找出答案的最好方法是拆卸我们的老式技术。此步骤对于每个设备都不同,但卸下您遇到的所有螺丝是一个很好的开始。
幸运的是,我们可以挽救原来的扬声器和开/关按钮。我们还保留了支撑所有按钮的部分。
在这个成功的操作之后,我们留下了一些可重复使用的组件和一个半空的框架。
有了我们新创建的空间和可重复使用的部件,我们继续下一步,添加我们自己的硬件。
其目的是制造一种语音可控、交互式、讲故事的设备。这意味着我们需要一个麦克风和扬声器,以及某种处理能力。Que Google AIY Voice Kit,一个非常适合我们努力的硬件包。
遵循他们的构建说明很简单,但我们连接的不是提供的扬声器和按钮,而是我们从旧收音机中恢复的那些。组装好所有硬件并准备就绪后,我们现在可以运行提供的任何示例。
在我们构建故事之前,我们需要想出一个合适的主题。如前所述,我们的收音机是 1960 年代在西德制作的。这是冷战时期的一个重要地点。
说到冷战,我们就想到了间谍活动,于是我们就有了我们的主题,间谍活动!
在我们继续构建聊天机器人之前,还有一个 TODO,即故事结构。因为我们希望我们的情节根据用户的输入而改变,所以我们需要设计一个决策树。完成后,我们都准备潜入下一步。
成功,故事完成后,我们可以开始使用聊天机器人了。理想情况下,我们应该有一款软件来帮助选择正确的回应,既能从口语文本中提取意义,又能做出情节决定。
这正是聊天机器人平台所提供的,既可以检测文本中的含义(“自然语言处理”),也可以做出决策。
那里有许多提供商,您可以选择其中任何一个,但是,我们选择了Google Dialogflow ,因为它免费且易于使用。Dialogflow 在这里有一个很棒的入门指南。
经过一些设置和创意写作后,聊天机器人已经准备就绪。现在我们将本地硬件与聊天机器人连接起来,将我们的发明转变为真正的语音机器人。
完整的代码包含在本文中,这是数据流:
1麦克风拾取说话的人并录制音频。
2-3使用一些 Google AI 魔法(Speech-To-Text ),我们从音频中提取语音文本。
4-5此文本被发送到我们的聊天机器人 ( Dialogflow ) 并与正确的响应相匹配,该响应被发送回 Raspberry Pi。
6-7使用一些更多的人工智能巫术,这个文本是用来生成人工语音的。
8此音频通过扬声器广播给此人。
注意:整个过程只有在收音机的按钮转到“ON”状态时才会激活。
经过所有这些艰苦的工作,终于是时候放松一下,放松一下,探索我们的交互式故事讲述者必须提供的所有不同可能性。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !