推动高性能计算 (HPC) 未来发展的趋势

电子说

1.2w人已加入

描述

2021 年,我们见证了 Covid-19 大流行如何实时影响高性能计算 (HPC) 和数据中心行业。虽然每个人都学会了掌握远程工作和学习的艺术,但对更多计算能力和更少延迟的需求推动了 HPC 市场的增长轨迹,甚至超出了专家在 2020 年初的预测。

随着尘埃落定,我们都已经习惯了“新常态”,我们已经习惯了新的工作方式、学习方法和一般的社交互动方式。这种数据处理和数据共享的整体灵活性和先进方法将持续到明年,使每个人的工作效率更高,信息更容易访问,协作更加无缝。因此,我们将继续看到 HPC 市场不断发展和扩大,越来越多的行业需要更多互连的硅架构以及高速网络。

以下是我们对 HPC 今年将进入的新市场、安全性日益重要以及支持 HPC 应用程序的不断发展的架构的主要预测。

去年,我们看到 HPC 被用于制造预防 Covid-19 的疫苗。我们将继续看到它被用于医学研究和监测,但 HPC 也将在 2022 年扩展到更新的市场。

斯科特·杜兰特:我们看到美国和全世界灾难性气候事件的数量在增加,能够预测这些事件以保护人们免受这些事件的影响变得越来越重要。这是一个应用程序,在来年将成为 HPC 领域的重点。除此之外,在云中 HPC 的可用性的推动下,我们将看到 HPC 更多地用于面向消费者的应用程序。从历史上看,高性能数据中心一直是孤立的,只有研究机构、政府和预算非常庞大的公司才能使用。我们将开始看到虚拟世界或最近开始被称为“元宇宙”的发展,既可用于娱乐,如游戏(增强现实和虚拟现实),也可用于模拟,如数字双胞胎。

Ruben Molina:你可以证明,过去被认为是 HPC 的东西每隔几年就会成为主流。我预测边缘的 HPC 将更多地成为规则而不是例外。工业部门将把 HPC 用于机器人技术、视觉系统以及预防性维护和监控中的应用,例如装配线上的预定或预测性故障——基本上,所有需要计算能力的工业领域都在使用设备的地方为了减少停机时间的需要。

Susheel Tadikonda:HPC 市场正在随着新的工作类型而扩展,将人工智能 (AI) 和数据分析添加到传统的模拟和建模中。COVID-19 的兴起强调了对云中灵活且可扩展的 HPC 解决方案的需求。再加上各个垂直行业(生命科学、汽车、金融、游戏、制造、航空航天等)对更快数据处理和更高准确性的需求日益增加,这将是未来推动 HPC 采用增长的主要因素年。AI、边缘计算、5G 和 Wi-Fi 6 等技术将拓宽 HPC 的能力,催生新的芯片/系统架构,为各个领域提供高处理和分析能力。

提高 HPC 安全性对于新设计至关重要

明年将要处理的数据量将呈指数级增长,这些数据的价值和敏感性也会随之增加。在设计 HPC 组件时,确保安全性是必不可少的组件(而不是事后考虑),这将是工程师今年和今后每年都将面临的最大设计挑战之一。

Susheel Tadikonda :HPC 系统包含高度定制的硬件和软件堆栈,这些堆栈针对性能优化、电源效率和互操作性进行了调整。使用自己的使用模式和独特的组件/属性来设计和保护此类系统,使其不同于其他类型的通用计算系统。安全威胁不仅限于网络/存储数据泄露,还包括侧信道攻击,例如从电源状态、排放和处理器等待时间推断数据模式。我们将看到更多围绕内存和存储技术、智能互连、支持芯片的安全性和云安全性的创新,以有效管理海量数据。安全验证/确认将代表安全保障中最关键的部分之一,涵盖架构、设计、

Scott Durrant:保护信息、保护数据的机密性和完整性以及提供对数据的访问控制的重要性显着增加。在过去的一年里,我们已经看到了勒索软件和其他网络攻击可能导致的各种问题。随着基础设施中数据的价值越来越大,攻击的数量将会越来越多,因此从硬件向上到堆栈的所有级别提供安全性以保护这些信息将变得越来越重要。”

Scott Knowlton:零信任框架也将被更多人采用。这意味着进入并想要访问数据的人需要验证他们的身份并证明他们有权访问数据。我们预计这将在未来一年左右进一步增加。事实上,我们已经看到了一些必要硬件的基础。此外,我们将在基础架构中的每个元素中看到嵌入的信任根。它使他们能够相互验证,并确保在与另一台设备共享数据之前,该设备有权使用和处理该数据。”

Ruben Molina:许多市场的数字化程度越高,安全风险的机会就越多。由于增加的高性能计算距离数据中心越来越远,因此无法通过软件补丁完全缓解的攻击机会将越来越多。这将给设计团队带来很大的压力,他们急于推出硬件来解决这些问题,这将导致硬件设计周期加快。提高设计师的生产力以跟上上市时间的需求将成为一项关键需求。

分解架构和异构系统的爆炸式增长

随着数据量的增加,需要考虑的不仅仅是安全性。必须增加存储基础设施以及处理这些数据的计算能力。新架构,包括 3DIC 和 die-to-die 连接,对于满足最新要求是必要的。

Susheel Tadikonda :HPC 架构正在经历一场翻天覆地的转变,这种变化的驱动因素是不断发展的 (AI) 工作负载、灵活计算(CPU、GPU、FPGA、DPU 等)、成本、内存和 IO 吞吐量。微架构层面的进步包括更快的互连、更高的计算密度、可扩展的存储、更高的基础设施效率、生态友好性、空间管理和更高的安全性。从系统的角度来看,下一代 HPC 架构将出现分解架构(将内存与处理器和加速器分离)和异构系统的爆炸式增长,其中不同的专业处理架构(FPGA、GPU、CPU 等)集成在单个节点中允许在细粒度的模块之间灵活切换。实现这种集成系统的一个关键方法是使用“小芯片”。如此复杂的系统带来了巨大的验证挑战,尤其是系统上下文中的 IP/节点级验证、动态硬件-软件编排、基于工作负载的性能和功率等。这将需要推动新的硬件-软件验证方法。

Scott Durrant:系统管理员今天面临的挑战之一是移动数据需要大量的电力和时间(两者都供应有限)。将处理移近数据以减少发生的数据移动量将是我们将在 2022 年看到加速的趋势。随之而来的是需要继续扩展资源。我认为我们将在来年看到真正进步的机制之一是利用先进的封装和裸片到裸片接口来支持更高性能的设备,即通过使用多个设备来扩展设备内的处理能力死。

Ruben Molina:除了通过将数据移近处理元件来减少延迟外,多芯片集成还允许通过将多个芯片组合在一个封装中来扩展计算能力,而无需使用前沿工艺技术的成本。为实现这一目标,设计人员需要能够对封装内多个芯片的时序和功率进行布局规划、布线和分析。另一种扩展计算能力的方法是为特定任务定制计算架构。公司已经开始为网络处理器和图形应用程序这样做,但是需要大量的前期架构探索才能在 RTL 中正确使用它,并且将大量精力放在可以在设计周期早期实现这些权衡的工具上.

Scott Knowlton:我们还看到了架构的分解。像 3DIC 这样的架构正在成为使设计人员能够将不同的裸片和封装放在一起以处理特定计算路径的关键。因此,现在他们可以使用 3DIC 和 die-to-die 连接设计封装,然后将其从特定组件外推到我们看到内存系统分解的机器中。这为我们提供了不同类型的设计和架构来处理特定工作流任务的独特机会。

审核编辑 黄昊宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分