至强® 可扩展处理器与 oneAPI工具套件强强联合，助力腾讯材料计算模拟平台TEFS实现更优计算效能

英特尔中国 2023-12-23 1173

描述

随着计算模拟在新材料研发方法和模式中扮演越来越重要的角色，材料研发领域也正寻求更高效、更便捷的材料计算模拟平台来加速计算模拟任务，提升新材料问世和落地的效率。来自腾讯量子实验室的材料计算模拟平台 TEFS（Tencent Elastic First-principles Simulation），借助腾讯云提供的强劲、易用和弹性可扩展的算力，以及对主流优秀材料计算模拟软件的编译集成，为高校和企业的材料研究人员提供了科学计算、数据可视化、工作流与机器学习以及项目管理等能力，使基于计算模拟方式的材料研发更具效率。

这一过程中，来自英特尔的先进产品与技术也从软硬件两方面入手，助力腾讯 TEFS 平台提升工作效能。在双方的合作中，第四代英特尔至强可扩展处理器和英特尔 oneAPI HPC 工具套件的加入，让平台的计算性能得到了显著提升，双方随后开展的验证测试也有力地证明了这一点。

“

利用计算模拟方式来加速新材料的研发进程，已成为材料设计领域的一个新趋势。腾讯 TEFS 平台的推出，正是借助腾讯云服务弹性可扩展的特性，帮助高校和企业的材料研发人员更高效、便捷地开展材料计算模拟任务。来自英特尔的第四代至强可扩展处理器和英特尔 oneAPI HPC 工具套件，为 TEFS 平台计算性能的提升提供了更加强劲的助力。

张胜誉

腾讯量子实验室负责人、腾讯杰出科学家

”

材料计算模拟发展普及

亟需更强平台予以支撑

作为新能源、半导体、智能制造以及生物医药等前沿科技的基石之一，新材料研究正在过去的数十年中获得极大的关注和高速发展，并拥有令人期待的市场发展潜力。数据表明，至2022年，中国新材料行业的市场总产值已达6.8万亿，近年来年均复合增长率接近 20%¹。

强劲的市场潜力推动新材料的研究方法与驱动模式发生了巨大的变化，从传统的经验驱动、理论驱动转向计算驱动和数据驱动。如图一所示，一系列优秀材料计算模拟软件，包括 VASP、Quantum ESPRESSO、LAMMPS 以及 GROMACS 等基于第一性原理和分子动力学等理论，形成以计算模拟为核心的新型材料研发模式。这些模式一方面有效解决了以往材料研发中研发周期长、实验成功率低以及投入成本高昂等问题，另一方面也积极推动着逆向材料设计、逆向物性预测、多尺度设计等新方法的发展。

cpu

图一常见的材料计算模拟软件

今天，无论是高校这样的科研、教学机构，还是专注于储能电池等产品研发的新能源厂商，都会把材料计算模拟软件的高效运行看成是材料研发的重要助力，而这无疑需要高性能的算力予以支持。传统上，研究者通常会通过自建的方式来构建科学计算模拟平台，但这一过程中，平台的使用也会面临以下一系列的挑战，包括：

算力层面：自有计算模拟平台的建设通常属于资本支出（Capital Expenditure，CapEX），在建设完成后，算力资源较为固定。当材料研究所需的算力发生变化时，往往缺乏足够的灵活性造成资源不足或资源浪费；

软件层面：不同的材料研究往往需要不同的计算模拟软件，使用者需根据软件特性分别开展相应的编译优化，其过程不仅需要耗费大量的时间成本且后期运维难度也更大；

使用层面：传统平台通常采用默认的命令行操作方式，不仅运行门槛高，同时后续环节所需的专业数据提取、分析也较为繁琐复杂，并缺乏便捷的数据可视化方案。

为助力新材料领域的企业、高校等有效应对以上挑战，腾讯旗下的腾讯量子实验室，以腾讯云为基础，通过融合科学计算系统、先进Web技术和人工智能（Artificial Intelligence,AI）能力，向研究人员推出具备一站式材料计算模拟服务的TEFS平台，并引入第四代英特尔至强可扩展处理器及其内置的英特尔 AMX 加速器、英特尔 oneAPI HPC 工具套件，以有效的性能优化助力研究人员在基于 TEFS 平台进行各类材料研究和探索时获得强劲助力。

至强与 oneAPI软硬协同

助腾讯TEFS平台打造先进科学计算能力

如图二所示，腾讯材料计算模拟平台 TEFS 从算力硬件、计算模拟软件和功能模块等不同维度出发，为企业、高校等的材料研究提供高效能支撑。首先在底层的算力硬件上，腾讯云为平台提供了弹性可扩展的计算资源。腾讯云以第四代英特尔至强可扩展处理器等高性能的处理器作为算力引擎，为平台提供了数十种服务器供使用者按需调用，其中单台服务器最多可达 192 超线程，512 GB 内存²。而内置的 TEFS HPC 算力调度系统，也令平台能灵活应对各类算力需求（例如材料计算模拟常用的高通量计算）有着大幅波动的场景。

cpu

图二腾讯材料计算模拟平台TEFS基本架构

在腾讯云之上，通过与计算软件生态合作伙伴的紧密协作，TEFS 平台预编辑了 VASP、LAMMPS 等数十种专业计算模拟软件，并集成了 Jupyter Notebook、VS Code 等计算环境，为研究人员打造了“开箱即用”的便捷使用体验。同时，平台还集成了腾讯自研的量子计算模拟软件 TensorCircuit 和量子计算化学软件 TenCirChem 。

基于以上软硬件基础能力，TEFS 平台为材料研究人员提供了科学计算、数据可视化、工作流与机器学习以及项目管理等多个功能模块。其中：

科学计算：通过全面打通算力、存储、网络以及软件能力，平台能以公有云、混合云等模式向企业和高校的材料研究人员提供兼具灵活性和可扩展性的科学计算能力，计算过程同步可见、计算结束结果自动下载，且支持 Slurm 和 PBS 两种作业调度系统。而基于 Web 页面的操作界面，也便于研究人员快速轻松上手；

数据可视化：如图三所示，平台原生支持 VASP、PWmat和 LAMMPS 等计算结果的可视化，并引入了基于第一性原理的高通量材料物性分析软件 VASPKIT Pro等来进一步增强平台的数据可视化能力。同时平台对Pymatgen、ASE和Matplotlib 等软件的绘图操作有着友好地支持；

cpu

图三 TEFS平台数据可视化示例

工作流与机器学习：平台能根据研发实际需求提供定制化的工作流，便于高通量计算筛选与材料数据库搭建。同时也能按需弹性调度计算资源，优化算力效率。而对于所生成的数据，平台提供了一站式的机器学习模型搭建、调试和训练等流程； 项目管理：平台以项目为单元，提供了丰富的管理功能，包括成员管理、资源监控、实验管理、数据管理以及文档管理等，能有效提升项目执行效率。

而在 TEFS 平台为企业和高校的材料研究提供有效助力的过程中，引入强劲的算力核心，并开展有针对性的优化也必不可少。而与英特尔的合作，正是 TEFS 平台在这一方向上的“杀手锏”。一方面， TEFS 平台底层构建于腾讯云之上，腾讯云在其中引入多款先进英特尔架构的处理器作为核心算力引擎。

以腾讯云 S7 中部署的第四代英特尔至强可扩展处理器为例，其全新的架构带来了更强的性能输出，不仅拥有更多的内核，更强的单核性能，性能更优越的内存子系统，并内置了多个加速引擎来支持科学计算中严苛的工作负载，例如其内置的英特尔 AMX 加速器可提高 CPU 的深度学习训练和推理性能，以及执行多线程任务时数据的高吞吐性能等。

值得一提的是，在材料计算模拟中通常会产生大量内存数据访存的需求，因此对内存子系统的性能有着更高要求。处理器具备大容量末级缓存，并支持 DDR5 内存，有效应对了这一需求。新一代 DDR5 内存不仅频率更高、工作电压更低，还具有远超 DDR4 内存的带宽速度。与 DDR4 内存 25.6GBps（3,200MHz）的带宽相比，DDR5内存带宽达到了 38.4GBps（4,800MHz）以上，提升幅度超过了 50%³，能有效支撑材料计算模拟过程对内存性能的巨大依赖，同时处理器加强的 AI 能力也为新兴的通用人工智能计算提供了更多可能和算力选项。

另一项来自英特尔的助力是英特尔 oneAPI 工具套件。作为基于新一代标准的英特尔软件开发工具，这一工具套件能帮助使用者充分利用英特尔架构硬件特性来加速不同计算进程，从而跨架构构建和部署高性能的应用程序。而腾讯与英特尔携手在 TEFS 平台中引入的英特尔 oneAPI HPC工具套件，是英特尔 oneAPI Base 工具套件的附加组件（需使用英特尔 oneAPI Base 工具套件才能实现全部功能），其包含了一系列性能更强大的编译器、功能更强大的库及高级分析工具，能帮助 TEFS 平台借助矢量化、多线程、多节点并行化以及内存优化方面的最新技术，在材料研发中实现更优的计算模拟性能。

腾讯TEFS平台性能显著提升

通过在众多企业、高校的部署实践，来自一线材料研究人员的反馈表明，TEFS平台能为材料研发领域的计算模拟带来显著优势：

高易用性：平台提供了基于浏览器/命令行的交互方式，具有友好的数据可视化界面和丰富的项目管理功能；

强扩展性：平台可基于不同类型腾讯云服务器开启任务，对多种材料计算模拟软件有着良好兼容，并具有存储动态扩容和计算节点弹性伸缩能力；

运维简单：平台支持一键升级与回退功能，拥有快速恢复与重启计算环境的镜像，无需硬件运维，按需调用资源；

高安全性：平台具备企业级数据安全保障，主机安全基础防护和基础DDoS防护能力，可做到资源高度隔离以及服务高可用。

同时，为验证第四代英特尔至强可扩展处理器和英特尔 oneAPI HPC 工具套件的引入，为 TEFS 平台的计算模拟性能提升带来的有效助力，腾讯与英特尔一起携手开展了验证测试，测试分为三个配置组进行对比：

基准组：基于第三代英特尔至强可扩展处理器的腾讯云S6服务器，实例规格：32 vCPU/64GB 内存；使用原生版本VASP，VASP参数设置：NPAR=2,KPAR=1, NSIM=4； 测试组1：基于第三代英特尔至强可扩展处理器的腾讯云S6服务器，实例规格：32 vCPU/64GB 内存；使用英特尔 oneAPI HPC工具套件最新版优化的VASP，VASP参数设置：NPAR=2,KPAR=1, NSIM=4； 测试组2：基于第四代英特尔至强可扩展处理器的腾讯云S7服务器，实例规格：32 vCPU/64GB 内存；使用英特尔 oneAPI HPC工具套件最新版优化的VASP，VASP参数设置：NPAR=2,KPAR=1, NSIM=4。

cpu

图四英特尔软硬件产品与技术带来的性能提升（归一化）⁴

测试结果如图四所示⁵，经数据归一化对比后，在同样使用腾讯云 S6 服务器（基于第三代至强可扩展处理器）的情况下，使用英特尔 oneAPI HPC工具套件最新版优化后，VASP 计算任务的执行性能相比基准组提升了约 13.39%。而将算力设备升级为腾讯云S7服务器（基于第四代至强可扩展处理器）后，性能相比基准组提升了约 43.87%，这表明，第四代至强可扩展处理器与英特尔 oneAPI HPC 工具套件能显著提升 TEFS 平台上材料计算模拟中 VASP 计算任务的处理效率。

随着计算模拟方式在材料研发中显现出更大的优势，以 TEFS 平台为代表的材料计算模拟云服务平台，也将在未来新材料研发中发挥出更为重要的作用，而计算性能的持续提升，也将为这一趋势持续提供助力。面向未来，腾讯还将与英特尔展开更多合作，将更多先进计算产品与技术应用到该领域中，助力更多新材料的问世与落地。

同时，双方在“科学计算+云服务”上的共同努力，也将运用于新材料研究之外的更多领域，包括基于电子设计自动化(Electronic Design Automation，EDA)的工业设计、计算机科学、基因组学、量子模拟以及生物制药等，从而让更多领域从科学计算能力中获益，加速产业发展。

参考资料：

1数据援引自公开媒体报道：https://www.chinairn.com/news/20230831/165403490.shtml2数据来源于腾讯，如欲了解更多详情，请访问：https://www.tencent.com/3根据 DDR4 与 DDR5 产品技术特性计算得到4、5数据来源于腾讯未公开的内部测试，如欲了解更多详情，请访问：https://www.tencent.com/

法律声明英特尔并不控制或审计第三方数据。请您审查该内容，咨询其他来源，并确认提及数据是否准确。英特尔技术特性和优势取决于系统配置，并可能需要支持的硬件、软件或服务得以激活。产品性能会基于系统配置有所变化。没有任何产品或组件是绝对安全的。更多信息请从原始设备制造商或零售商处获得，或请见 intel.com。没有任何产品或组件是绝对安全的。描述的成本降低情景均旨在在特定情况和配置中举例说明特定英特尔产品如何影响未来成本并提供成本节约。情况均不同。英特尔不保证任何成本或成本降低。

打开APP阅读更多精彩内容