服务机器人想要达到智能化程度,定位导航、人机交互及环境交互这三大通用底层技术必不可少,上一篇对于定位导航技术我们已做出详细讲解,感兴趣的小伙伴可点击在百度搜索:《智能机器人三大核心技术(一)》进行查看。在拥有基础的自主定位导航技术后,机器人想要进一步发挥自身作用,还需要拥有人机交互能力。人机交互技术可让机器人进一步了解人类,了解用户诉求,从而为用户提供更个性化的服务。
从第一代以键盘鼠标为交互方式的PC互联网时代,到第二代以触屏为主的移动互联网时代,再到今天以多模态人机交互方式的第三代互联网,人机交互形式发生了巨大的变化。
目前,人机交互技术主要包含语音识别、语义理解、人脸识别、图像识别、体感/手势交互等技术。通过语音识别、合成、理解等技术,实现更精准的营销和专属服务。通过人脸识别,可帮助商家精准的识别用户,并主动与用户打招呼,提升用户体验……。这些交互方式的改变将会深层次的影响我们日常生活的应用场景。
基于语音的人机交互是当前人机交互技术中最为主要的表现形式,语音人机交互过程中包含信息输入和输出的交互、语音处理、语义分析、智能逻辑处理以及知识和内容的整合。结合语音人机交互过程,在人机交互中的关键技术中包含了自然语音处理、语义分析和理解、知识构建和学习体系、语音技术、整合通信技术以及云计算处理技术。
自然语音处理技术:包括中文分词、词性标注、实体识别、句法分析、自动文本分类等技术。
语义分析和理解:包括知识表示、本体理论、分领域的语义网络、机器推理等。
知识构建和学习体系:包括搜索技术、网络爬虫、数据挖掘、知识获取、机器学习等技术。
语音技术:包括语音识别、语音合成和声纹识别等。
整合通信技术:包括跨平台即时通讯整合技术、超大负载消息集群处理技术、移动客户端开发技术。
云计算技术:包括海量数据分布式存储、统计和分析技术。
经过科研人员的不断努力,目前语音交互技术已成功进入商用门槛,如今在智能手机、智能音箱、智能台灯等设备中大多采用了语音人机交互技术,随着语音人机交互技术应用价值的逐渐显现,众多企业纷纷布局语音人机交互领域,如科大讯飞、谷歌、捷通华声等企业。随着布局企业的不断增多,语音人机交互的产业规模也在不断扩大,并带动了机器人、家电、汽车等相关产业的发展。
除了语音人机交互,基于视觉的人机交互技术也是目前研究的一大热点,对于一个人来说最为主观的就是看脸部表情,未来机器人也需要理解人的感情,这当中就会涉及到人脸识别技术,包括特征提取及分类,目前在该技术中,对于人类基本的七种表情识别率可达到百分之八十左右,当然目前还是一些比较明显的表情,如在高兴或者发怒的情况下,但在人的自然交流过程中,人的表情还是比较平淡的,对于机器人来说,目前还难以达到准确的分辨效果,这些过程是需要进行一些更加复杂的特征来提取。
当然,除了对脸部表情的理解,手势也是人最为直接的表现形式,通过一些手势也可以达到很多的命令,不同的手势形状可以构成不同的动作指令。虽然手势有很多种,但可以找到比较容易记忆的手势,然后进行交互。
手势识别是人机交互的重要手段之一,通过手部的动作直接控制计算机,相比传统的键盘、鼠标等控制方式,具有自然直观和便于学习等优点。
目前常用的手势识别方法主要包括基于神经网络的识别方法、基于隐马尔可夫模型的识别方法和基于几何特征的识别方法。基于神经网络的手势识别方法,具有抗干扰、自组织、自学习且抗 噪声能力等优点,但训练时需要采集的样本量大,且对时间序列的处理能力不强。基于隐马尔可夫模型的识别方法,能够细致的描述手势信号,但拓扑结构一般,计算量相对较大。基于几何特征的识别方法,是根据手的区域及边缘 几何特征关系进行手势识别,该方法无需对手势进行时间上的分割,计算量小,
随着移动机器人和手势识别的发展,人机交互技术也在不断更新,自从微软推出Kinect体感外设以来,自然的人机交互成为当前的研究热点,通过Kinect外设,可以解除人们受键盘、鼠标等传统交互方式的束缚,具有重要的意义。
全部0条评论
快来发表一下你的评论吧 !