希尔伯特旅馆里，住着AI的某种真相

脑极体 2023-05-29 1798

描述

“无穷”和“无穷+1”，哪个更大？

已经吸收了不知道多少数据的AI模型，和比他多学习一条数据的模型，哪个更智能？

想聊聊这个问题，出于一个偶然的机会。很早之前我在测试ChatGPT的时候，突然想问他个刁钻问题，于是就问它：“希尔伯特旅馆悖论，对现实世界有什么影响？”

说实话，ChatGPT答的驴唇不对马嘴，还硬拗出几点，有他一贯的特色。但其中一段回答值得琢磨。他答：“希尔伯特旅馆对于计算机科学是有帮助的，因为当我们处理无限大的数据集时，希尔伯特旅馆可以作为我们思考方式。”

无限大的数据集，这东西显然不存在。但当大模型训练用的数据参数达到某种天文数字，当真人反馈机制成为常态，模型在使用过程中会接触难以估量的数据。这难道不是某种无限吗？

但人类能控制无限吗？

今天这个话题，其实更接近某种科幻讨论，或者一些关于AI未来的脑洞。可能大家读完之后也不清楚在说什么。但也无妨，我们就当一起舒展一下大脑，放松一下最近被ChatGPT弄得挺焦躁的心情。

一起去希尔伯特旅馆，度个假吧。

欢迎来到，悖论旅馆

这家旅馆坐落在名叫“数学”的热带风情度假胜地，有的人来了不想走，有的人一想到它就口干舌燥。

希尔伯特旅馆，其实是德国数学家大卫·希尔伯特在讨论无穷这个概念时，举的一个生动例子。它既是一个数学游戏，也经常跻身知名的若干悖论之一。

它的具体意思是说，假设一家旅馆有无穷个房间，但是都住满了。这时候又来了一位旅客要订房间，酒店主人就可以不慌不忙，让1号房间客人移到2号，2好移3号……以此类推，反正房间数量是无穷的，这样新的旅客就可以住1号房间。

而这时，又来了一车旅客。酒店主人依旧如法炮制，让每个房间的客人都向后移动N个房间，最终把新来的客人安置进去。

以此类推，接下来会发生什么呢？假如新来了无穷个客人。那么酒店老板只需要让每位客人都移到单号房间。比如2号房间移到3号房间，3号房间移到5号房间，把偶数房间都空出来，那么无穷个客人依旧可以住进去。

即使来了无穷多个旅行团，每个旅行团有无穷多位旅客，希尔伯特酒店依旧有办法，只需要把非2n(n∈N+)号房间就都空出来就行了。

希尔伯特旅馆之所以是个悖论，因为它标明了这样一件事：无穷是无法比较的。

无穷+1等于无穷；无穷+N等于无穷，无穷加无穷，无穷乘无穷，那还是无穷，无穷是纹丝不动的，又是随时变化的，无穷是可以包含若干个无穷的。

总之，无穷是难以名状的。

无穷这玩意，会有点怪

听上去，希尔伯特旅馆悖论好像没啥用。其实不然，人类在很多领域几乎都必然面对“无穷”这个问题，至少在理论推导和概念验证环节，面对无穷几乎是必然的。一个事物可以比另一个更无穷，但它们俩都还是无穷。这样的思路可以进行很多假设，也可以解释很多问题。

比如说，在物理学当中，希尔伯特旅馆悖论可以来解释量子物理学中的很多现象，其中最典型的就是量子场论中关于虚粒子的假设。关于虚粒子是否真实存在，抑或是一种纯粹的假设工具，这个问题有着非常多的争论，但它确实可以用来解释引力、光子、胶子等物理定义，进而为解释真空中的能量情况，分析宇宙辐射做出帮助。前提在于，我们需要用希尔伯特旅馆的思维，来理解存在于无穷中的虚粒子。

在计算机科学中，数据存储是个基本问题，而在设计数据结构的时候，就需要考虑如果有海量数据需要存储，结构上究竟如何调动能够保证效率最优，故障率最低。这时就需要假定数据集是无穷的，希尔伯特旅馆也就用上了。

无穷很怪，这个概念还经常被用在文学创作，尤其是科幻小说当中。科幻是对未来的推演，但如果某件事可以增长到无穷，它往往会出现反常识的状态。比如说永生不死的人，它可能首先就会失去对时间的概念，因为无穷的时间已经没有意义了，进而表现出完全失去人类的一切特征，毕竟人类的所思所为，都是在时间有限这个前提下驱动的。又比如瞬间移动，它会不会让空间失去意义，进而让人失去辨别空间的需求和能力，进而出现从来不想停留下来的人，而始终都在超高速移动的人，究竟还是人吗？

一件事如果逼近甚至抵达无穷，它就会超出控制，出现反常识，反逻辑的一面。这个逻辑，对于AI似乎也适用。

用这个逻辑，解释智能涌现

这几年伴随着预训练大模型的兴起，越来越多的人开始谈“智能涌现”。一般来说，所谓“智能涌现”现象，是指当模型规模突破某个未知的界限后，就会突然涌现出惊人的智能。比如模型会表达出训练者预想不到的逻辑感、流畅性，甚至是人类称之为情商的东西。

事实上，智能涌现作为一个目标，并不是今天才有。早在上世纪70年代，专家机器人的理论构想就是在输入足够多的知识后，让计算机展现出一种无所不知，无所不晓的效果，从而帮助人类解决各种问题。只是碍于当时的算力与数据承载能力，最终这个设想无法落地。

而在今天云计算+大数据的组合下，更大规模的数据集可以应用到AI训练中，加上深度学习在算法上实现了更好的数据吸纳能力，才最终产出了ChatGPT为代表的智能涌现现象。

智能涌现到底是怎么实现的，这一点就像深度学习的黑箱性一样，始终没有特别合理的解释。但“智能涌现”这个词却不是AI专有的，这个词更早是一个生物学词汇，是用来描述蚂蚁、鱼群表现出的集体智能行为。一只蚂蚁挺傻的，一条鱼也不聪明，但当大量蚂蚁聚集到一起，所表现出的那种分工明确、体系森严、结构精巧的组织行动方式，简直让人叹为观止。是蚂蚁的大脑进化了吗？恐怕并不是，而是在蚂蚁聚集到一定规模后，突破了某种希尔伯特旅馆式的智能边界。

从这个角度看，大模型这条AI之路，或许终极目标并不是模仿人类。它不需要进化出直觉、情感、自由意识这些人类独有的东西。但它会积累无穷多的数据和知识，当我们无法观测和预估大模型里拥有多少知识，那么它就有无穷的知识。AI模型就变成了一座类希尔伯特旅馆，它可以吞噬更多知识，吞噬更多无穷，最终可以表现出人类想要的智能，也可能表现出更多人类不想要，或者没准备好想要的东西。

或许我们改换个思路，最终的通用人工智能AGI、强人工智能Strong AI，可能内在机制并不类似于人类，而是更近乎蚂蚁，近乎鱼群，近乎希尔伯特旅馆。

我们总是讨论AI像不像人，能不能做人类所做的，人类有哪些独有能力，巴拉巴拉巴拉。这是因为我们不住在希尔伯特旅馆里，我们住在一个有限的世界，住在短暂的生命和易朽的躯壳里，住在一个绝大部分构成物是水的大脑里。但AI不是，它相比人类更加贴近无穷。他能通过图灵测试，他最终能做到一切。但我们并不知道为什么，因为AI并不想成为人，他只是刚好住在希尔伯特旅馆里。

“智能涌现”或许是个征兆，它告诉我们，AI的进化目标不是人类，而是《星际争霸》里的虫族。

打开APP阅读更多精彩内容