在边缘计算、Chiplet、人工智能和机器学习、CaaS(容器即服务)以及可持续性发展的推动下,高性能计算变得越来越重要。
高性能计算(HPC)的概念在过去几年中不断发展,无论是在其严格的定义方面,还是如何使用它。如今,HPC 不再局限于大型数据中心、研究实验室和超级计算机,而是在各个行业中用于产品设计、财务建模、天气预报等任务。它已经渗透到更接近我们日常生活的应用程序中,它能够将更强大的计算机功能带入我们依赖和享受的家庭、办公室和汽车体验中。
HPC 增长和扩展的根本原因可以归结为一个词:数据。因为其中有更多数据需要比以往更快地处理、分析和移动。高性能计算解决了更多数据产生、服务和消费无限循环——无论是智能家居的多服务流媒体习惯、日益互联的汽车,还是我们完成工作、监控我们的健康或管理我们的财务所需的信息量。
随着对 HPC 需求的增长,对更快、更强大、更高效的半导体的需求同步攀升。事实上,尽管芯片业务的整体起伏不定,但HPC行业仍实现了持续和可持续的增长。那么,2023 年高性能计算的未来是什么?
边缘(分布式)计算的增长
毫无疑问,边缘计算是改变计算格局的关键发展趋势,但它似乎与传统HPC相差较多。 高性能计算往往与大型集中式计算和存储资源相关联,而这些资源实际上是基于云的远程计算的支柱。相比之下,边缘计算以处理网络边缘或附近的数据为中心,而不是将其一直发送回中心位置。通过这种方式,它可以提供更低的延迟,并且在许多情况下可以提供更安全的操作特性。
边缘计算与传统计算正在融合。由于数据的爆炸式增长,在边缘生成的数据量在数量和复杂性方面呈指数级增长,包括由智能化需求推动的各种物联网 (IoT) 设备。 边缘计算主要用于延迟和内容,因为往返云/集中式数据中心的往返将无法满足所需的响应时间。在某些情况下,文件太大,无法发送到云进行处理甚至存储。 这可能影响城市交通管理和相关的自动驾驶系统、精准医疗、欺诈检测、商业智能、智能城市开发等。
边缘计算将对 HPC 系统供应商、云服务提供商、网络和存储供应商产生重大影响,因为组织希望将远程 HPC 功能与本地生成和处理的数据策略相结合。作为其中的一部分,还希望看到HPC的物理足迹从集中式交付模型扩展到更加分布式的方法,其中包括靠近大量数据生成边缘站点的位置。
从芯片设计来看,边缘计算虽然仍然需要最佳的功耗、性能和面积(PPA),但仍然具有另一个关键优先事项:减少这些设备处理和数据传输的延迟。设计策略必须优先考虑这些IC的数据传输速度和效率,例如下面讨论的Chiplet架构。当然,芯片设计解决方案必须考虑PPA权衡方案的所有方面,并提供高级功能来设计和分析针对任何给定应用要求的优化IC。这包括强大的仿真和验证工具、功耗和热分析功能、设计布局的智能实现,以及一系列用于关键功能和接口的认证 IP 模块。展望未来,我们将看到从数据中心到电池供电的物联网设备对能够降低功耗的设计解决方案的需求不断增加。
Chiplet成熟
HPC的最新趋势之一是使用多芯片系统。多芯片系统在高性能计算领域获得了青睐,作为保持摩尔定律(由于器件物理和制造传统单片硅架构的经济挑战而放缓)走上正轨的一种方式。简而言之,传统的单片片上系统(SoC)变得过于庞大和昂贵,无法用于高级设计,并且良率风险随着设计尺寸的增加而增加。多芯片方法作为扩展摩尔定律的PPA优势的可行方法很有吸引力,无需增加芯片面积或功耗即可提供更多的处理能力。 它们还支持异构混合搭配方法,以最大限度地利用目标应用优化的工艺技术。分解 SoC 组件,单独制造它们,然后将这些不同的功能整合到单个封装中,从而减少浪费,同时提供一种快速创建具有优化系统功耗和性能的新产品变体的方法。
虽然多芯片系统完全有能力成为 HPC 的基本推动因素,但设计方法必须不断发展以应对新的挑战。 例如,支持高带宽、低延迟、高能效和无差错性能的芯片到芯片接口对于快速、可靠的数据传输至关重要。需要增强的工具、方法和 IP 来处理这种多芯片方法引起的异构集成、互连和封装问题。 先进封装和硅光子学等领域的其他专业知识和技术对于推动创新和设计效率达到新的水平非常重要。
人工智能和机器学习的扩展范围
另一个贯穿 HPC 各个方面的重要趋势是人工智能 (AI) 和机器学习的兴起。这是 HPC 享有共生关系的领域。
一方面,高性能计算机需要为人工智能工作负载提供动力,这在当今自动化数据密集型世界中无处不在。对于HPC供应商来说,这是一个快速增长的领域,他们几乎在有计算需求的地方看到了新的机会。但是,为了支持AI工作负载,计算平台需要不断改进底层硬件的性能,这给芯片设计人员带来了不断创新的压力。在这里,人工智能也与支持人工智能的设计工具一起发挥作用,现在用于通过优化复杂或过于详细的任务来处理尖端芯片设计的复杂性和规模,这些任务可以最好地由训练有素的人工智能算法处理。这不仅提高了整体工程效率,而且使设计师能够专注于更多以创新为导向的工作。
另一方面,高性能计算依赖于人工智能本身来高效安全地运行数据中心。无论是监控存储、服务器和网络设备的运行状况和安全性,确保正确配置,预测设备故障,以及筛选恶意软件数据,AI 都能为 HPC 用户提供更高水平的洞察力和预测性维护。人工智能还可用于通过优化加热和冷却系统来减少电力消耗并提高效率,这是数据中心运营商最关心的关键可持续性问题。
高性能计算系统案例
随着业务各个方面所需的计算能力的大幅提高,许多公司正在寻求“即服务”模型的价值,以满足其周期性计算需求。输入 HPC 即服务 (HPCaaS),除了峰值工作负载效率之外,此类模型还为没有内部知识、资源或基础设施的公司提供服务和支持,无法通过云利用 HPC。HPCaaS 使 HPC 容量易于部署、扩展,并且从成本角度来看更具可预测性。
在IC设计领域,人们对这种模型非常感兴趣,该模型可以访问执行数据密集型芯片设计任务所需的计算资源。由多核架构组成的复杂 HPC IC 设计就是一个很好的例子。它们需要增加计算、存储和处理以进行设计和开发。通常需要并行处理大量数据,以实现这些类型设计的设计和验证的收敛。这种托管模型正在被大型半导体公司和初创公司使用,这些公司和初创公司正在为HPC开发高性能芯片,这是一种有趣的共生关系,HPC的推动者也取决于其功能。
与其他 HPCaaS 企业用途一样,基于云的 EDA 在 IC 开发过程中提供了可扩展性、灵活性、生产力和安全性。公司可以根据特定的使用需求、高峰设计时间和分布式工作结构调整 HPC 访问,所有这些都不需要专门的资源管理专业知识。所有这些好处都与性能吞吐量优势相提并论,这是对 EDA 工具的关键需求。
可持续发展成为舞台中心
尽管我们以最快的速度改进了 HPC 功能,并在生活的许多方面扩展了收益,但正在为这些耗电系统对环境的影响付出代价。一些专家预测,到2030年,仅数据中心就将消耗全球3%至7%的电力。在地方层面,许多数据中心遭到了强烈反对,甚至由于所需的电力和水量,新建筑也面临许可障碍。为这些大型计算平台提供动力和冷却已成为可持续发展的热点,而电源使用效率 (PUE) 和碳排放等指标是首要考虑因素。
许多HPC公司和云服务公司提出创新理念来应对这些挑战。通过可持续能源(水力、太阳能、风能)为数据中心供电的根本转变正变得越来越普遍。也衍生了许多新方法,例如沉浸式或液体冷却技术(包括水下数据中心);将数据中心消耗的能源和水重新分配和回收用于其他用途(例如,为建筑物供暖);供应链生态系统使用更环保的组件、材料和制造方法都具有巨大的潜力。HPCaaS 模型本质上也是一种资源效率更高的方法。
也可以在芯片级别提高能耗和散热效率。例如,高性能计算IC设计可以通过使用先进的低功耗设计方法和功耗优化的IP核来更好地优化功耗,从而降低芯片和整个系统的整体能耗。
Chiplet趋势提供了另一种降低功耗的重要潜在方法,更不用说通过提高产量来减少制造中的物理浪费。对功耗更敏感的数据传输方法,如高带宽存储器(HBM),也可以使芯片及其供电的系统更加节能。这些都得到了标准和开源工作(如CXL,UCIe和OCP)的帮助。
总之,HPC行业正在不断发展和扩大,每天都为我们的生活带来新的改善。
审核编辑:汤梓红
全部0条评论
快来发表一下你的评论吧 !