智能机器人三大核心技术（二）

领衔资讯 2019-09-23 6684

描述

服务机器人想要达到智能化程度，定位导航、人机交互及环境交互这三大通用底层技术必不可少，上一篇对于定位导航技术我们已做出详细讲解，感兴趣的小伙伴可点击《智能机器人三大核心技术（一）》进行查看。在拥有基础的自主定位导航技术后，机器人想要进一步发挥自身作用，还需要拥有人机交互能力。人机交互技术可让机器人进一步了解人类，了解用户诉求，从而为用户提供更个性化的服务。

从第一代以键盘鼠标为交互方式的PC互联网时代，到第二代以触屏为主的移动互联网时代，再到今天以多模态人机交互方式的第三代互联网，人机交互形式发生了巨大的变化。

智能机器人

目前，人机交互技术主要包含语音识别、语义理解、人脸识别、图像识别、体感/手势交互等技术。通过语音识别、合成、理解等技术，实现更精准的营销和专属服务。通过人脸识别，可帮助商家精准的识别用户，并主动与用户打招呼，提升用户体验……。这些交互方式的改变将会深层次的影响我们日常生活的应用场景。

基于语音的人机交互是当前人机交互技术中最为主要的表现形式，语音人机交互过程中包含信息输入和输出的交互、语音处理、语义分析、智能逻辑处理以及知识和内容的整合。结合语音人机交互过程，在人机交互中的关键技术中包含了自然语音处理、语义分析和理解、知识构建和学习体系、语音技术、整合通信技术以及云计算处理技术。

自然语音处理技术：包括中文分词、词性标注、实体识别、句法分析、自动文本分类等技术。

语义分析和理解：包括知识表示、本体理论、分领域的语义网络、机器推理等。

知识构建和学习体系：包括搜索技术、网络爬虫、数据挖掘、知识获取、机器学习等技术。

语音技术：包括语音识别、语音合成和声纹识别等。

整合通信技术：包括跨平台即时通讯整合技术、超大负载消息集群处理技术、移动客户端开发技术。

云计算技术：包括海量数据分布式存储、统计和分析技术。

经过科研人员的不断努力，目前语音交互技术已成功进入商用门槛，如今在智能手机、智能音箱、智能台灯等设备中大多采用了语音人机交互技术，随着语音人机交互技术应用价值的逐渐显现，众多企业纷纷布局语音人机交互领域，如科大讯飞、谷歌、捷通华声等企业。随着布局企业的不断增多，语音人机交互的产业规模也在不断扩大，并带动了机器人、家电、汽车等相关产业的发展。

除了语音人机交互，基于视觉的人机交互技术也是目前研究的一大热点，对于一个人来说最为主观的就是看脸部表情，未来机器人也需要理解人的感情，这当中就会涉及到人脸识别技术，包括特征提取及分类，目前在该技术中，对于人类基本的七种表情识别率可达到百分之八十左右，当然目前还是一些比较明显的表情，如在高兴或者发怒的情况下，但在人的自然交流过程中，人的表情还是比较平淡的，对于机器人来说，目前还难以达到准确的分辨效果，这些过程是需要进行一些更加复杂的特征来提取。

当然，除了对脸部表情的理解，手势也是人最为直接的表现形式，通过一些手势也可以达到很多的命令，不同的手势形状可以构成不同的动作指令。虽然手势有很多种，但可以找到比较容易记忆的手势，然后进行交互。

手势识别是人机交互的重要手段之一，通过手部的动作直接控制计算机，相比传统的键盘、鼠标等控制方式，具有自然直观和便于学习等优点。

目前常用的手势识别方法主要包括基于神经网络的识别方法、基于隐马尔可夫模型的识别方法和基于几何特征的识别方法。基于神经网络的手势识别方法，具有抗干扰、自组织、自学习且抗噪声能力等优点，但训练时需要采集的样本量大，且对时间序列的处理能力不强。基于隐马尔可夫模型的识别方法，能够细致的描述手势信号，但拓扑结构一般，计算量相对较大。基于几何特征的识别方法，是根据手的区域及边缘几何特征关系进行手势识别，该方法无需对手势进行时间上的分割，计算量小，

随着移动机器人和手势识别的发展，人机交互技术也在不断更新，自从微软推出Kinect体感外设以来，自然的人机交互成为当前的研究热点，通过Kinect外设，可以解除人们受键盘、鼠标等传统交互方式的束缚，具有重要的意义。

打开APP阅读更多精彩内容