电子说
宇宙中大部分物质都是人类看不见的暗物质。目前,观测暗物质的最佳方式:引力透镜技术的成本太高,耗时太久。最近,研究人员希望利用AI技术来解决这个问题,提出了一种基于对抗生成模型的新方法,名曰“CosmoGAN”。
随着宇宙学家和天体物理学家对宇宙中最黑暗的凹陷的探索越来越深入,对越来越强大的观测和计算工具的需求呈指数级增长。科学家们正在寻求收集、模拟和分析可以帮助解释的越来越多的数据,解释我们看到或看不到的事物的本质。
目前,引力透镜技术是科学家提取这些信息的最有前途的工具之一。根据伯克利实验室国家能源研究科学计算中心(NERSC)数据科学团队负责人Deborah Bard的说法,引力透镜以某种方向视线中物质的数量确定遥远星系的图像,并提供了一种观察暗物质二维图的方法。
“引力透镜是研究暗物质的最佳方法之一,这种方法让我们了解了很多关于宇宙结构的信息,”她说。 “宇宙中的大部分物质都是暗物质,我们无法直接看到,因此必须使用间接方法来研究暗物质的分布。”
但随着实验和理论数据集规模的增长,以及对这些数据进行成像和分析的模拟,出现了一个新问题:这些模拟实验的成本越来越高,计算成本非常昂贵。因此,宇宙学家经常采用在计算上更便宜的替代模型,这类模型可以对昂贵的模拟实验进行二次模拟。
不过最近,“基于神经网络的深度生成模型的进步,让许多类型的模拟器(包括宇宙学中的模拟器)构建性能更强大、手工设计部分更少的替代模型成为可能,”机器学习工程师Mustafa Mustafa说。 他是NERSC一项新研究的主要作者,该研究描述的新方法就是基于二次模拟,由伯克利实验室、谷歌研究院和夸祖鲁-纳塔尔大学合作开发。
研究团队由伯克利实验室领导,主要研究用于科学应用的各种深度生成模型。团队采取一种独特的策略:生成对抗网络(GAN)。
在近日发表在计算《天体物理学和宇宙学》期刊上的论文中,研究人员考虑了新的基于GAN的深度学习网络,名为CosmoGAN,并说明了其创建高保真、弱引力透镜会聚图的能力。
“它实际上是我们在沿着视线的天空中看到的引力透镜的二维图,”论文作者之一Bard说。 “如果图中有一个峰值,相当于沿着视线方向存在大量物质的峰值,也就是说该方向上存在大量暗物质。”
CosmoGAN的优势:性能强大精度高
为什么选择GAN而不是其他类型的生成模型?据Mustafa表示,主要是因为性能和精度问题。
“从深度学习的角度来看,还存在其他方法可以学习如何从图像生成收敛图,但是当我们启动这个项目时发现,与其他方法相比,GAN可以生成非常高分辨率的图像,同时仍具备在计算成本和神经网络规模的成本效应上的优势。“他说。
“我们寻求两点:准确和快速,”论文共同作者,伯克利实验室计算宇宙学中心的研究科学家ZariaLukic补充说。 “与完整的模拟相比,GAN提供了几乎同样的准确率。”
研究人员特别感兴趣的是构建一个可以降低运行这些模拟的计算成本的替代模型。在论文中,他们概述了GAN在大型物理模拟研究中的许多优点。
“GAN在训练期间非常不稳定,特别是在训练结束时,生成的图像开始看起来很好,但是可能网络一更新,就会变得一团乱。”Mustafa说。 “但是因为我们掌握了宇宙学中的汇总统计数据,我们能够在训练的每一步中对GAN进行评估GAN,这有助于我们确定最好的生成器。通常这个流程不用于训练GAN。“
使用CosmoGAN生成器网络,团队已经能够生成具有高统计信度的收敛映射,数据汇总统计与完全模拟映射相同。收敛图之间的这种非常高水平的一致性,在统计学上与基于物理的生成模型生成的图无法区分,这是深度神经网络构建仿真器的过程中迈出的重要一步。
“这里的巨大优势在于,我们处理的问题是一个与相关指标有关的物理问题,”巴德说。 “但是通过我们的方法,有一些实际指标可以量化GAN的准确度。对我来说,真正令人兴奋的是:这些物理问题会对机器学习方法产生什么影响。
最终,这些方法可以改变现有暗物质搜寻实验中过于依赖计算力和存储空间、以及极其耗时的问题。但未来仍有仍有大量工作要做。宇宙学的数据(以及一般的科学数据)可能需要非常高的图像分辨率的量度,比如全天空望远镜图像。
“在这个项目中考虑使用二维图像是有价值的,但实际的物理模拟是三维的,结果可能随时间发生不规则的变化,产生丰富的网状结构特征,”论文共同作者、NERSC大数据与分析服务团队的数据架构师WahidBhmiji说。 “此外,我们需要对该方法进行扩展,以探索新的虚拟宇宙,而不是已经模拟过的虚拟宇宙,最终构建一个可控的CosmoGAN。”
“做可控GAN的想法实际上是整个问题的最高目标:真正模拟基于可控GAN的替代模型的物理模拟器,现在我们正在过去几年领域内的进步的基础上,努力了解如何稳定GAN的训练动态。这对于实现这个最高目标而言非常重要。”他说。
全部0条评论
快来发表一下你的评论吧 !