电子发烧友网报道(文/李宁远)在生成式AI、大模型已经席卷了各行各业的当下,人形机器人是最受备受关注的机器人类型。在人形机器人或者说仿生双足机器人之前,仿生四足机器人也是备受关注的存在。
四足机器人,更为人熟悉的名字是机器狗,在很多舞台上我们已经见到过机器狗灵活的表演。这些多足机器人可以代替人类在很多环境中完成机动作业,是高敏捷性、快速运动的代表机器人类型。
离线大模型+机器狗
当前,机器人正在与人工智能技术深度融合,仿生四足机器人也不例外。虽然现在机器人的控制、计算、多模态感知融合等方面还有很大挑战需要克服,但是我们也看到了人工智能功能正在机器人身上得到初步应用。
去年宇树科技发布的Go2就搭载了大模型用于强化交互,今年不久前,西北工业大学光电与智能研究院宣布联合中国电信人工智能研究院在探索离线具身智能应用方面就取得了阶段性进展。
西北工业大学团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出离线大模型具身智能导盲机器狗,验证了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。
根据相关报道,该机器狗使用的是InternLM2大模型,这是商汤科技与上海AI实验室联合香港中文大学、复旦大学发布的大模型。InternLM2庞大的训练基础和优越的性能表现在同类模型中是比较突出的,同时它也保持了开源和商用免费授权。
在该应用中,西北工业大学团队结合目前最新的大模型量化压缩和加速推理技术,成功将1.8B的大模型部署到了机器狗的计算平台上。1.8B离线大模型与机器狗内置的2Nano+1NX边缘算力验证了离线具身智能的可行性。
据悉,该项目会进一步与电信星辰大模型相结合,探索在线与离线相融合的分布式异构具身智能机器人方案。
灵活的机器狗,强大的底层硬件
除去大模型给终端应用带来的智能化决策和计划生成,机器狗作为高敏捷性、快速运动的代表机器人类型,离不开底层硬件赋予它基础性能。
目前机器狗配置,已经是相当豪华。在感知上,各类传感器加持的机器狗已经可以感知周围的各种环境。以小米的CyberDog2为例,深度摄像头、RGB摄像头、语言摄像头、触摸传感、激光雷达、超声波、ToF均有搭载。4D激光雷达现在也开始应用在机器狗上,这些传感配置让机器狗既能看到也能感知。
在核“芯”的配置上,同样以小米的CyberDog2为例,NVIDIA Jetson Xavier NX加全志MR813也是很经典的机器人方案,CyberDog2还额外加了一颗全志R329协处理器。
高算力保证机器狗可以流畅地处理从传感器系统捕获的大量数据,使其能够更精准地进行机器狗的避障及路径选择,并处理智能交互相关数据。MR813,在扫地机器人中常见的型号,主要负责算法执行、运动控制、电源系统管理等工作,由它驱动机器狗身上的电机做出高精度的动作响应。另一个协处理器则主要处理语音交互。
仿生四足机器人能实现灵活的运动,全面的感知以及智能的交互,背后是这些强大基础底层硬件与人工智能技术融合合力推动的。
小结
随着具身智能概念越来越热,还会有不少AI大模型在机器人终端上落地的进展。基础且强大的底层硬件构建起了灵巧敏捷的四足机器人,AI大模型和四足机器人的融合落地会进一步拓宽机器狗的应用场景。
全部0条评论
快来发表一下你的评论吧 !