魔方可谓20世纪80年代的标志性智力玩具,如今它正在被用作连接深度学习与高等数学之间的桥梁。
计算机科学教授Pierre Baldi是加州大学欧文分校(UCI)研究团队从事此项工作的负责人,他认为深度学习与高等数学之间的“鸿沟”是当今人工智能所面临的最大难题。
“大家会抱怨深度学习是一个黑盒子,他们不知道这个网络在做些什么。”Baldi说道,“而我们可以看到该网络正在学习数学。”
自从匈牙利雕塑家兼建筑学教授Ernő Rubik于1974年发明了魔方之后,这种各个面色彩不一的立方体就开始让人们为之着迷和困惑。
研究团队发现,深度学习模型可以用于教会机器如何做数学题(这里是一种被称为“群论”的代数概念),这就是Baldi所说的“AI 重大挑战中的一小步”。
无心插柳
研究人员最初的目标是构建一个深度学习模型,可在无需任何人工协助的情况下解开魔方,就像早期的模型掌握了国际象棋的游戏方式一样。
为了实现这一目标,他们像教小孩子一样引导模型学习如何还原魔方。
从已还原的魔方开始,模型首先向后倒退一步,然后还原魔方。接着向后倒退两步并还原魔方,随后再向后倒退三步,如此类推。这会让算法在每一次尝试中逐渐学习。Baldi将这一过程比作学习高尔夫球,首先从近距离推杆进球开始,然后随着精确度的提升而逐渐远离球洞。
该研究团队最近发表了一篇论文,详细介绍了他们的工作。该团队为其开发出的增强学习算法起了一个名字:“自学迭代(autodidactic iteration)”。该算法可在平均30步之内完全还原被打乱的魔方,也可以实现人类玩家所能达到的最快速度。
研究人员在训练该模型时使用了搭载NVIDA GPU的机器,同时还使用了CUDA编程模型、TensorFlow机器学习框架和Keras神经网络API。
据Baldi估计,GPU将工作速度加快了5到10倍,并且其团队可以无限制地将更多GPU投入使用,进一步推动深度学习研究。
“我们对GPU求之若渴,”他说道,“它们对于这项工作来说必不可少。”
充满无限可能的一次进步
Baldi表示,魔方展现了一个独特的深度学习挑战:魔方的正确解法只有一种,但错误的组合形式却有数百亿亿之多。这里用的还只是传统的三阶魔方,每个面各有9个方块。
解开更高阶的魔方是该团队的下一个奋斗目标。他们想知道将这种“自学迭代”的方式应用于四阶和五阶魔方的效果如何。但首先,团队必须对该方法进行调整,以应对大幅提高的复杂度。
“如果将速度降至原来的二分之一,则不会出现什么问题。”Baldi说道,“但如果将速度减慢到与大陆漂移的速度一样,那么问题就来了。”
同时Baldi发现,也可以利用这种方式教会自学迭代模型掌握其他游戏的玩法。
他认为这项工作在其他数学领域也具有潜在的应用机会,尤其是高中水平以上的数学内容。他表示,AI一直在努力实现这一点。
而Baldi的团队对此的看法则是这种难题很快就会成为明日黄花。同时,解开更复杂、更困难的问题才是其奋斗目标。
全部0条评论
快来发表一下你的评论吧 !