如果将人工智能(AI)比喻为一个正在成长的孩子,那么规模法则(Scaling Law)就是其成长过程中的核心驱动力。只要给予这个“孩子”充足的数据、模型和算力这些“营养”,它便能茁壮成长。2020年,OpenAI发表的《神经语言模型的规模法则》论文,为大语言模型的发展奠定了理论基础,也让规模法则成为了AI领域的基石。
然而,胡英东博士指出,当前的AI模型还远未达到真正的通用性,无法应对用户提出的各种复杂指令。在2024年11月4日的上海第七届中国国际进口博览会上,机器人与媒体记者的互动虽然引人注目,但距离真正的通用智能还有一段距离。
如今,规模法则正在为机器人领域打开一扇全新的大门。清华大学交叉信息研究院(IIIS)的研究团队在预印本网站arXiv上发表的论文《机器人操作模仿学习中的数据规模法则》显示,在规模法则的指导下,机器人实现了真正的零样本泛化,无需任何微调就能适应全新的场景和物体,成功率高达90%。泛化能力是指模型或算法在处理新数据时的表现,这一突破意味着机器人正在向理解和适应物理世界迈出重要一步。
胡英东博士是嵌入式AI领域的专家,他研究了开发通用机器人系统所面临的挑战,特别是这些系统如何适应不同的、非结构化的现实世界环境。在IIIS团队的研究中,便携式手持夹爪UMI在8种从未见过的环境中展现出了惊人的适应能力。
ChatGPT的问世验证了规模法则的“智能涌现”能力,即规模越大,效果越优。然而,在机器人领域,全面的规模法则尚未建立,因此其发展速度并未像深度学习领域那样迅速。为了探究数据规模法则,IIIS团队设计了物体泛化、环境泛化及环境-物体组合泛化三大维度,通过调整训练数据规模,评估数据规模对机器人策略泛化性能的影响。
研究发现,策略的泛化性能与环境和训练时接触的物体数量之间存在显著的幂律关系。当环境多样性足够丰富时,单一环境中过度采集不同操作物体的数据所带来的效用将变得微乎其微。此外,单个物体的演示数据很容易达到饱和,总演示数据达到800次时,性能就开始趋于稳定。
尽管IIIS团队的研究取得了显著成果,但胡英东博士表示,目前的研究还仅限于单任务策略的数据规模,并未探索多任务的通用性。此外,要实现商业化应用,还需要达到更高的成功率。他相信,未来会有通用机器人的出现,但目前仍有许多重要的研究问题需要解决。
在学界努力的同时,企业界也在积极将通用人工智能引入物理世界。OpenAI等巨头正在开发大规模AI模型和算法,为机器人提供动力。虽然有人将IIIS团队的最新研究称为“人形机器人的ChatGPT时刻”,但胡英东博士认为,这个时刻还未真正到来,需要更多的技术突破。
然而,他相信这项技术最终会进入日常实际应用,如餐馆的服务机器人、养老院的护理机器人等。这些应用将极大地改变人们的生活方式,提高生活质量。
全部0条评论
快来发表一下你的评论吧 !