改善要求苛刻的EDA计算任务 是否在优化云计算优势以加快可靠性验证?

EDA/IC设计

1065人已加入

描述

设计的复杂性和上市时间的压力迫使公司寻找利用可用资源的创新方法。云计算提供了一个可扩展且可持续的平台,可以显着改善要求苛刻的 EDA 计算任务(如 Calibre PERC 可靠性验证流程)的运行时间。我们展示了公司如何使用云资源来提高生产力和加快周转时间,然后使用这些数据来了解云计算的成本/收益关系并确定提供最大回报的最佳配置。

在当今快速发展的工业和消费产品中,集成电路 (IC) 设计公司知道,按计划或提前将其设计推向市场对于保持或获得竞争成功至关重要。然而,他们也知道,他们的产品上市后的性能同样至关重要。将产品推向市场,却无法实现广告所承诺的性能或产品寿命,这是公司永远不想拥有的噩梦。

因此,可靠性验证现在是 IC 设计和验证流程的重要组成部分。随着设计转向最先进的工艺节点,可靠性问题的范围和复杂性,例如静电放电 (ESD) 和闩锁保护,已经大幅增加(图 1)。作为回应,大多数代工厂现在提供某种形式的可靠性设计规则,这些规则由电子设计自动化 (EDA) 公司以自动化可靠性验证工具和检查的形式启用 [1-3]。

IC设计

图 1. 检查计数复杂性和 ESD 路径密度在工艺节点上的增长。

当然,与其他所有形式的自动化 IC 设计验证一样,运行可靠性验证流程需要时间和资源……有时比公司所能提供的还要多。并非每家公司都有能力获取和管理足够的现场计算资源,以按计划进行可靠性验证流程。幸运的是,现在有了另一个答案——云计算。

在使用代工厂规则平台验证完整芯片时,使用 3 方云计算资源满足“高峰需求”时期,是一种可扩展且可持续的及时可靠性验证方法。但是,公司需要清楚地了解云计算的要求、限制和成本,以便在采用云技术选项时做出明智的成本/收益决策。

使用云服务器时,公司根据使用的服务器数量、机器类别和总使用时间收费。要使用的最佳云服务器数量及其配置取决于您运行的可靠性验证流程的类型、您使用的 EDA 工具、设计的规模、您的流片时间表以及您的公司有多少钱愿意或能够在云访问上花费 [4]。

为了展示在云中运行可靠性验证流程的潜在优势,我们使用西门子 EDA Calibre PERC 可靠性验证流程和主要商业云服务对全芯片系统级芯片 (SoC) 设计进行了一系列实验提供者。我们在不同数量的云服务器上总共运行了 3 次相同的 Calibre PERC 流程(使用相同的 SoC 设计和规则组):

  • 1 台具有 16 个物理内核的云服务器,采用 Calibre 多线程 (MT) 技术
  • 5 台云服务器,每台具有 16 个物理内核,采用 Calibre flexible MT (MTflex) 技术。这 5 台服务器在 Calibre MTflex 配置中组织为 1 个主服务器 + 4 个远程服务器。
  • 51 台云服务器,每台有 16 个物理内核,采用 Calibre MTflex 技术。在 Calibre MTflex 配置中,51 台服务器被组织为 1 个主服务器 + 50 个远程服务器。

我们记录了每个流的运行时间并比较了结果,如图 2 所示。对于 1 个服务器、5 个服务器和 51 个服务器,Calibre PERC 运行分别在 106 小时、31 小时和 9.5 小时内完成。此外,与单机 MT 运行相比,每次 MTflex 运行的内存减少了 10%。

IC设计

图 2. 不同云配置的 Calibre PERC 运行时比较。

将 Calibre PERC 可靠性平台用于此特定设计和检查集,愿意在云硬件上花费 3 倍成本的公司可以实现大约 3 倍的运行时间改进。在许多无晶圆厂 SoC 设计公司中,将多天的 Calibre PERC 流程转变为通宵运行具有巨大的商业价值,尤其是当他们知道需要多次迭代时。

当然,成本和运行时间改进之间的实际比例会因公司而异,甚至在设计和流程节点之间也会有所不同。最终,在云硬件资源上运行可靠性验证流程以满足高峰需求使用可以提高生产力并加快周转时间,但每家公司都必须开发自己的数据集,使其能够做出最有利于业务目标的实际云计算决策那家公司的。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分