人工智能
强人工智能时代,多模态交互技术成为关键。
人工智能的三个发展阶段
经过半个世纪的发展,人工智能已经有了巨大的飞跃。按照人工智能的发展程度,我们可以将其分为三个阶段:
△资料来源:Venture Scanner,平安证券研究所
计算智能:机器具备像人类一样的记忆能力和计算能力,从而能够存储和处理海量数据。能够帮助人类完成大量的存储和复杂的计算。这一步是感知和认知的基础。
感知智能:机器具备像人类一样的感知能力,通过“眼睛”、“耳朵”、“皮肤”等器官,机器也拥有视觉、听觉、触觉等感知能力。能够帮助人类完成“看”和“听”的简单工作。
认知智能:机器具备像人类一样的学习和思考能力,能够独自做出决策和采取行动,能够部分或全部替代人类的工作。
人工智能正处于弱人工智能时代
目前,人工智能的发展仍然处于弱人工智能范畴,主要解决计算智能和感知智能层面的问题,但是距离达到能够独立思考、做出决策的强人工智能时代还有一定距离。
弱人工智能主要是在某个特定领域擅长的专一人工智能,如语音识别和图像识别等侧重计算能力和数据积累的领域。
而单模态交互技术是弱人工智能时代典型的代表特征,集中在单一模态的感知技术的给智能机器产品带来了很多的局限性。
单模态交互技术的局限性
目前,感知技术作为人工智能最重要的一环在近几年遍地开花,虽然机器的单点 AI 感知模态能力逐步走向完善,语音交互、机器视觉、传感器智能技术均获得极大发展。但单点 AI 模态感知在产品应用上具有较大的局限性。
单一模态的信号输入,让机器缺乏主动服务能力,且误判指令、错误唤醒的状况时有发生,这些都在影响用户体验的本质提升。
如智能音箱,作为当下最火热的智能机器,一阵浪潮之后,大家会发现单纯的语音交互已经无法满足使用者对智能机器更高的需求。
强人工智能下多模态交互的趋势
强人工智能主要是指能够学习知识、思考问题和解决问题的的通用智能,机器具有多通道的知觉并且具有意识,在各方面都能和人类比肩。
人工智能如果需要在生活中有更好的体验,我们希望它能像人体一样,能耳目鼻口耳协同工作,主动提供服务。
而多模态交互技术则是实现上述需求的关键。
今天主要的 AI 感知模态有三种:
语音交互(包括语音指令控制、语义理解、多轮对话、NLP、语音精准识别等领域);
机器视觉(包括自然物体识别、人脸识别、肢体动作识别等);
传感器智能(包括 AI 对热量、红外捕捉信号、空间信号的阅读与理解、机器视觉、传感器智能)。
在强人工智能时代里,多模态能把这三种感知模态融合在一起,物联网设备在单纯的能听会说之外,同时还用摄像头观察、用传感器判断。把不同的信号模态整合在一起,实现设备的多维感知和思考,让智能机器走向服务的人性化和主动化。
炬芯科技首颗多模态交互芯片
经过半个世纪的发展,在近十年,人工智能技术步入了发展的快车道,高性能的计算芯片甚至 AI 芯片、海量的数据积累和优秀的软件算法都在推动人工智能向更深处不断发展。
炬芯科技在单模态交互芯片设计上拥有多年的经验积累,相关产品广受市场认可。面对人工智能的时代跃迁,我们也在向着更进一步的技术延伸发展。
本次,炬芯推出旗下首颗多模态交互芯片,炬芯 ATS 3609D,多麦智能语音、轻智能图像、手指点读双模态识别输入解决方案。ATS 3609D 将语音交互、机器视觉和传感器三个模态综合起来,为强人工智能下的多模态交互提供可行的解决方案。
ATS3609D Key Feature
● 双核架构支撑更高计算能力● DSP NN LIB,提高算法效能● 语音、手指、LCD反馈、touch panle协助,多模态交互● 全格式图片解码、主流 SWF 格式解码、完善音视频播放器、支持视频通话直播,专为电子教育设计
充足的算力,超低的功耗、强大的可扩展性,将赋予智能机器更多的可能性。
强人工智能时代中多模态交互技术的未来及展望
我们可以发现,市场上逐渐出现一些新的声音:
智能空调通过语音交互结合机器视觉及传感器实现智能送冷;电视通过机器视觉识别照明、距离等环境因素实现智能亮度调节;工业设备通过机器视觉辅助传感器或故障信号提高工业设备安全性;……
越来越多的多模态交互技术开始被应用于各类场景,突破智能机器传统的单点感知,实现设备多维感知和思考,让智能机器走向服务的人性化和主动化。
AI 多模态交互技术已经成为人工智能交互的必然趋势,我们也期待着炬芯多模态交互平台 ATS 3609D 芯片能在更多的场景中应用开来,赋予机器更强的智能属性,用更加像人的智能机器给大家带来更好的服务。
责任编辑:ct
全部0条评论
快来发表一下你的评论吧 !