电子说
上世纪70年代,日本早稻田大学研发全球首个全尺寸人形“智能”机器人—— WABOT-1。此后全球陆续推出不同品类、应用在不同场景的人形机器人,除特斯拉外,波士顿动力、丰田、本田、小米、优必选等均有相关产品推出。但人形机器人产业化难度大,主要原因在于关键技术掣肘、成本仍高昂、应用场景有限等,本田、软银等公司已宣布停产有关人形机器人产品。
2021年AI Day上,马斯克发布了特斯拉的人形机器人计划,当时的Tesla Bot仅是概念。历时1年,在2022年9月的AI Day上,人形机器人Optimus正式亮相。随后2023年5月的股东大会,Optimus已能够实现物品分类等更复杂的任务。2023年12月,Optimus Gen-2视频发布,Gen-2实现了更为灵活的行走,能轻松拿捏鸡蛋并实现左右手的转移等更为精细化的动作。在不到三年时间内Optimus实现快速迭代发展,人形机器人产业化或将呈现由点到面、在某一阶段快速渗透的趋势。
表|特斯拉Optimus近2年迭代升级情况
来源:特斯拉发布会、与非网整理
接下来,笔者将带领大家一起回顾和总结学习3年来,特斯拉人形机器人的发展历程、主要成果及技术进步等做以梳理和拆解。以便大家了解特斯拉人形机器人快速迭代升级的原因,未来如果售价不超过2万美元,产业化核心痛点击破后是否能将带动行业快速发展。
概念提出
1、Tesla Bot诞生
2021年8月20日的AI Day,特斯拉公布了纯视觉方案FSD的进展、神经网络自动驾驶训练、D1芯片、Dojo超级计算机等重磅信息。最后,特斯拉首次展示了其人形机器人的概念, 名叫Tesla Bot。笔者以为,FSD、神经网络训练、超级计算机等看似为汽车行业做配套,实则是为人形机器人的采集训练所需要的各种模型参数和提供强大的算力基础设施,为人形机器人做好了大量铺垫。
图|Tesla Bot
来源:特斯拉AI Day
Tesla Bot身高约1.72米,体重约56.7kg,集齐前述的FSD、车载计算机、Autopilot摄像头和40个微型电机等所有技术与一身,可谓人工智能技术的最终极形态呈现。技术细节上,头部被安装用于导航的摄影机,透过人工神经网路(Artificial Neural Network)驱动,面部有一块萤幕,用于展示与提供讯息,手部可以执行宛如人类手部程度的动作。
2、底层FSD技术
特斯拉的纯视觉传感器方案的实现,离不开多任务学习HydraNets神经网络架构。每辆特斯拉汽车拥有8个环绕车身、覆盖周围360°的摄像头,来获取交通信号灯、信号牌、匝道、路缘等周边信息,为神经网络学习提供了绝佳条件。
特斯拉开发了“矢量空间”(Vector Space)技术,同时兼具了非凸优化算法(Non-convex)、高维度两大优势。该技术可以通过8个摄像头输入的数据为基础绘制3D鸟瞰视图,形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆把握驾驶环境,更精准的寻找最优驾驶路径。
来源:特斯拉AI Day
有了海量、精准的视频数据,特斯拉还需要创造一个强大的神经网络,并对网络进行特殊的布局,使这些数据能在一个总的主干网络上进行整合和重新分析。因此,特斯拉“高楼平地起”,自主研发了基于神经网络的训练方式。
同时,特斯拉还开发了“仿真场景技术”,可以模拟现实中不太常见的“边缘场景”用于自动驾驶培训。在仿真场景中,特斯拉工程师可以提供不同的环境以及其他参数(障碍物、碰撞、舒适度等),极大提升了训练效率。
来源:特斯拉AI Day
由此,特斯拉FSD系统已可以实现每1.5毫秒2500次搜索的超高效率,预测可能出现的各种情况,并在其中找到最安全、最舒适、最快速的自动驾驶路径。
3、Dojo超级计算机
随着所需处理的数据开始指数级增长,特斯拉也在提高训练神经网络的算力,因此,便有了特斯拉Dojo超级计算机。组成Dojo超级计算机的关键单元,是特斯拉自主研发的神经网络训练芯片——D1芯片。D1芯片采用分布式结构和7纳米工艺,搭载500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里,实现了超强算力和超高带宽。
Dojo超级计算机的单个训练模块由25个D1芯片组成。由于每个D1芯片之间都是无缝连接在一起,相邻芯片之间的延迟极低,训练模块最大程度上实现了带宽的保留,配合特斯拉自创的高带宽、低延迟的连接器;在不到1立方英尺的体积下,算力高达9PFLOPs(9千万亿次),I/O带宽高达36TB/s。
图|特斯拉FSD芯片+D1芯片
来源:特斯拉AI Day
至此,特斯拉已经为Tesla Bot量身打造了最底层的FSD技术和Dojo超级计算机平台,只等Optimus的诞生了。马斯克还补充:“未来劳动力不会短缺,但体力劳动只是一种选择。Tesla Bot可以执行一些危险性、重复性、枯燥的任务。”
Optimus Gen-1发布
1、原型机发布
时隔1年,即2022年9月30日,首款人形机器人原型机"擎天柱"(Optimus Gen-1)在AI Day上正式亮相。现场演示为原型机行走打招呼,视频演示为办公室浇植、工厂拿取结构件、识别周围物体渲染图等。
Optimus Gen-1搭载2.3kWh容量电池,并采用集成式的设计,可提供52V电压。全身有28个关节,整个身体的自由度超过 200个,手掌设计部分通过六个致动器完成11个角度的自由动作,并能够举起超过20磅的物体。针对每个关节所需的力量/扭矩进行了仿真建模,并据此研发了6种专用电机,采用与特斯拉汽车电机同源的滚珠电机技术,可以实现各个关节的旋转和直线运动控制。
图| 执行器技术
来源:特斯拉AI Day
Optimus Gen-1搭载了与特斯拉车辆相同的FSD技术以及Autopilot相关神经网络技术,其大脑使用的是自研的AI训练 Dojo D1芯片和超级计算机 Dojo,在经过完全自动驾驶能力系统的实际应用验证后,特斯拉强大的FSD计算机视觉技术已可直接应用于机器人。
通过搭载视觉相机,结合全身28关节执行器,以及底层FSD视觉算法和Dojo超级计算机提供算力支撑,Optimus Gen-1终于诞生。
2、第一次迭代
2023年3月:历时5个月开发,视频中显示人形机器人可以实现独立的直立行走,且 能在另一台机器人上实现装配任务,手指关节可满足抓取电动工具、螺丝、覆盖在相框上的布等任务要求。
Optimus 电机扭矩控制、力度控制更加精确灵敏;环境感知和记忆能力提升,不仅可以看路,亦会记路;还可根据人类动作范例,进行端到端动作操控。
2023年5月,FSD Beta已累计行驶接近2 亿英里。FSD能够应用在人形机器人,本质在于自动驾驶的模拟过程与机器人相同,即“输入-计算机平台-输出”。通过视觉系统识别周围环境,将数据传输至计算平台,平台将反馈传输给执行器等环节,产生动作。基于FSD的技术和数据积淀,构建核心竞争力,特斯拉 Optimus将拥有和其他机器人产品不同的智能化升级优势。
3、第二次迭代
Optimus 拥有了自我校准手臂和腿部的能力,仅使用视觉和关节位置编码器,它就可以在空间中精准定位自己的肢体。
视觉感知能力提升明显,算法与模型不断进步。机器人Optimus可通过视觉与关节位置编码器,在空间中精确定位四肢,能够自我校准手臂和腿,同时可自主按照颜色对物品进行筛选分类与排序,神经网络实现端到端训练学习。可以看出特斯拉已经打通了FSD和机器人的底层模型,依赖神经网络模型和视觉技术,不断优化FSD算法,在感知环境与自主分析做出运动方面表现较好,同时特斯拉Dojo平台有望进一步增强机器人AI能力,特斯拉人形机器人量产有望加速。
手部抓取与全身平衡表现亮眼,运动控制能力逐步提升。机器人Optimus可通过手指灵活抓取物品并放置指定位置,同时可做出类人的全身伸展运动,包括瑜伽单腿站立并保持平衡。
Optimus-Gen2发布
2023 年 12 月 13 日,特斯拉发布第二代人形机器人 Optimus-Gen2 演示视频,对比一代机主要变化为:
1、整体性能提升:
1)特斯拉采用自主设计的执行器和传感器,执行器中集成了电子部件,走路速度提升了30%。
2)在机器人整体性能不下降的情况下,重量相比上一代人形机器人减重10kg。
3)全身协调性明显提升,主要体现在做深蹲等动作时的平衡能力提高。
2、结构设计:
1)颈部:新增2个自由度,执行器及传感器数量增加;
2)足部:仿真人足几何学设计,脚趾部分采用了铰接式的连接方式,使用力/扭矩传感器;
3)手部:共11个自由度,手指搭配压力式触觉传感器,可精准抓握细小易碎品例如鸡蛋等;手指活动速度更快,并且能够用拇指和食指两根手指从左手传递到右手,并且精准地拿起和放下鸡蛋。
3、新增变化方面:
1)新增了2自由度的能够主动控制的脖子关节,使得头部能够活动。
2)脚部做了类似人体结构的足弓设计,新增了脚趾关节,新增了脚部力/力矩感知功能。
3)所有手指均具备了触觉感知能力。
全新灵巧手设计,具备触觉感知能力。本次最新的进展视频中展示了特斯拉全新设计的灵巧手,具备更快的响应速度和11个自由度,手指上具备触觉传感器视频中演示了其双指将生鸡蛋轻拿轻放的能力。
相比于第一代Optimus人形机器人,第二代Optimus在手指上新增了触觉传感器,触觉传感器可以赋予机器人更精细的力反馈能力,有望提升人形机器人的工作能力,使其能够完成更多任务,如精细的装配、柔性物体操作等。在更多传感器的加持下,机器人的应用场景有望进一步打开。
总结
Optimus人形机器人在硬件上实现升级换代,核心关节及零部件设计、整机协调控制等或均有大幅优化,机器人的灵活性控制能力显著提升。预计2024实现部分量产,2025年大规模进入工厂等场景使用。
特斯拉人形机器人将兼具工业和家庭用途,能够执行工业生产中的复杂任务和家庭服务,最终实现劳动力替代。据高工机器人产业研究所,2026年全球人形机器人在服务机器人中的渗透率有望达到3.5%,市场规模超20亿美元,到 2030年,全球市场规模有望突破200亿美元。随人形机器人产品智能化程度不断提升,远期市场空间更为广阔。马斯克认为,人形机器人可能比电动车业务做的更大,未来数量超过100亿-200亿台。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !