经典硬件在qbit仿真中的作用

IEEE电气电子工程师 2023-10-13 1648

描述

在将其Grace Hopper芯片直接与量子处理器集成，并在经典超级计算机上展示模拟量子系统的能力之间，英伟达本月在量子计算领域掀起了波澜。

英伟达当然已经做好了利用后者的准备。它制造了超级计算机使用的GPU，与人工智能开发人员渴望的GPU相同。这些GPU作为在经典计算机上模拟数十个量子位的工具也很有价值。新的软件开发意味着研究人员现在可以使用越来越多的超级计算资源来代替真正的量子计算机。

但模拟量子系统是一项要求极高的挑战，而这些要求就在背后若隐若现。

经典计算机在模拟量子硬件方面有两个作用。首先，量子计算机构建者可以使用经典计算来测试他们的设计。伦敦帝国理工学院博士后研究员Jinzhao Sun表示：“经典模拟是理解和设计量子硬件的一个基本方面，通常是验证这些量子系统的唯一手段。”

另一方面，经典计算机可以运行量子算法来代替实际的量子计算机。正是这种能力让研究分子动力学、蛋白质折叠和新兴的量子机器学习领域的研究人员特别感兴趣，所有这些都受益于量子处理。

经典模拟并不是真正量子物品的完美替代品，但它们经常制作合适的传真。世界上只有这么多量子计算机，而经典模拟更容易访问。经典模拟还可以控制困扰真实量子处理器的噪音，并经常破坏量子运行。纽约州厄普顿布鲁克黑文国家实验室的计算机科学和机器学习研究员Shinjae Yoo表示，经典模拟可能比真正的量子模拟慢，但研究人员仍然可以节省时间。

因此，捕获是一个大小问题。由于量子系统中的一个量子位与该系统中的其他量子位纠缠在一起，因此精确模拟该系统的需求呈指数级增长。根据经验，每增加一个量子位，模拟所需的经典内存量就会增加一倍。从单个GPU移动到整个八个GPU节点需要增加三个量子位。

许多研究人员仍然梦想着在这个指数斜率上尽可能地向上推进。Yoo说：“如果我们正在进行分子动力学模拟，我们希望有更大数量的原子和更大规模的模拟，以获得更真实的模拟。”

GPU可以加速量子模拟

GPU是关键的立足点。Yoo说，用GPU换CPU可以将量子系统的模拟速度提高一个数量级。这种加速可能并不令人惊讶，但由于GPU之间发送信息的瓶颈，很少有模拟能够充分利用这一优势。因此，大多数模拟都停留在一个多GPU节点甚至该节点内的单个GPU的范围内。

一些幕后的进展使缓解这些瓶颈成为可能。英伟达的cuQuantum软件开发套件使研究人员更容易在多个GPU上运行量子模拟。GPU以前需要通过CPU进行通信，这造成了额外的瓶颈——像Nvidia的NCCL这样的集体通信框架允许用户直接在节点之间进行内存到内存的复制等操作。

cuQuantum与加拿大初创公司Xanadu的PennyLane等量子计算工具包配对。作为量子机器学习社区的坚定支持者，PennyLane让研究人员在量子计算机上使用PyTorch等技术。虽然PennyLane是为在真正的量子硬件上使用而设计的，但PennyLanne的开发人员特别添加了在多个GPU节点上运行的功能。

从理论上讲，这些进步可以让经典计算机模拟大约36个量子位。在实践中，这种规模的模拟需要太多的节点小时才能实现。如今更现实的金本位是20s。尽管如此，这比几年前研究人员所能模拟的还要多出10个量子位。

也就是说，Yoo在Perlmutter超级计算机上工作，这台超级计算机是由数千个Nvidia A100 GPU构建的，旨在培养和运行人工智能模型的能力，即使在中国，这些模型的销售也受到美国政府出口管制的限制。西方相当多的其他超级计算机使用A100作为支柱。

经典硬件在qbit仿真中的作用

经典硬件的规模能否继续增长？挑战是巨大的。从拥有160G GPU内存的英伟达DGX到拥有320GB GPU内存的DGX，只不过是一个量子位的跳跃。Jinzhao Sun认为，试图模拟100多个量子位的经典模拟很可能会失败。

真正的量子硬件，至少在表面上，已经远远超过了这些量子位的数量。例如，IBM已经稳步将其通用量子处理器中的量子位数量增加到数百个，并雄心勃勃地计划将这些数量增加到数千个。

这并不意味着模拟在千量子位的未来不会发挥作用。经典计算机可以在模拟大型系统的各个部分中发挥重要作用——验证它们的硬件或测试有朝一日可能以全尺寸运行的算法。事实证明，使用29个量子位可以做很多事情。

审核编辑：彭菁

打开APP阅读更多精彩内容