使用UCIe IP确保多Die系统可靠性

电子说

1.3w人已加入

描述

来源:半导体芯科技杂志

作者:Manuel Mota, Synopsys 高级产品经理

多Die(晶粒)系统由多个专用功能晶粒(或小芯片)组成,这些晶粒组装在同一封装中,以创建完整的系统。多晶粒系统最近已经成为克服摩尔定律放缓的解决方案,生产保证较高良率,提供一种扩展封装后芯片功能的方法。

此外,多晶粒系统实现功能扩展满足不同细分市场的需求,意味着使产品SKU(Stock Keeping Unit库存单位)更为灵活,在同一产品中混合和匹配各种工艺节点来实现工艺的优化,从而缩短上市时间和降低风险。

为了实现更高的晶粒间走线密度并支持晶粒间更高的带宽流量,封装技术已发展为基于硅中介层(带TSV过孔)或硅桥,以及近期出现的再分配层(RDL)扇出和HD基板来创建新的先进封装。

多晶粒系统成功的关键在于能够确保系统在不同制造和组装阶段的可测试性,并确保在现场可靠运行。通过使用额外的组装步骤和更复杂的bump(金属凹点)和封装技术,多晶粒系统需要测试和可靠性程序,这些程序相比于单片测试更为复杂。

裸晶粒和封装本身应进行预测试,以确保在封装之前检测到所有缺陷的晶粒或封装。如果在封装后才检测到有缺陷的晶粒,则必须报废整个多晶粒系统,从而会付出高昂的成本代价。裸晶粒的测试过程称为已知良好晶粒(KGD)测试。

组装流程本身因所选的封装技术而异。例如,chip first技术(晶粒优先放置,并且互连构建在这些晶粒之上)不允许KGD(已知良好封装)测试,这可能导致如果互连有故障,则会报废良好晶粒。而chip last技术,互连是单独构建的,晶粒组装在其顶部,这可以在组装之前对封装进行预测试,从而低良好晶粒被报废的可能性。多晶粒系统可测试性解决方案分为几个方面:

1.测试晶粒内各个块的覆盖率

2.测试单个晶粒(裸晶粒)的覆盖率

3.测试组装后的系统(晶粒间覆盖率)

4.访问裸晶粒的测试网络

5.组装后对测试网络的分层访问

晶粒

△图1:使用内置备用链路进行链路修复。

本问描述了一种利用UCIe IP来确保多晶粒系统可靠性的全面可测性方案,并介绍其优势。

用于UCIe接口的DFT

通过在UCIe IP中实施全面的可测试性功能,在裸晶粒测试阶段将有缺陷的晶粒排除在外,从而实现UCIe接口的高测试覆盖率的解决方案。部分功能包括:

1.扫描链路覆盖所有综合后的数字电路

2.专用模块特定自测试(BIST)功能

3.环回内置自测试(BIST)功能,覆盖到IO引脚的完

整信号链路

4.可编程伪随机二元序列(PRBS)和用户定义的测试

序列生成器和检查器

5.错误注入以消除错误通过风险

此外在封装后,将覆盖范围扩展到晶粒间链路的功

能,可以帮助实现高水平的测试覆盖范围,包括:

6.远侧(晶粒间)BIST环回功能

7.晶粒间链路BIST

8.分析边缘的2D眼图边界

9.各个通道的测试和维修功能

UCIe测试和维修

先进封装可实现高密度布线,在硅或RDL interposer(中介层)上进行细间距,微凸焊点和高密度布线。在组装过程期间,一些微凸焊点的链路可能未良好建立且可能断掉。UCIe能够在组装后测试和修复这些连接,从而挽回潜在的良率损失。

在生产测试和链路初始化期间执行UCIe测试和修复。在测试阶段,以低速检查每个链路是否存在缺陷。通过将数据重新路由到UCIe标准预定义的备用链路,来修复有缺陷的链路。

针对先进封装的UCIe配置包括每个方向最多8个备用引脚(TX和RX),以便修复所有功能链路,这其中包括:

1-4个备用引脚,用于数据引脚修复,每组32个数据引脚中有2个备用引脚

2-1个备用引脚,用于时钟和跟踪引脚修复

3-3个备用引脚,分别用于有效引脚、边带数据引脚和时钟数据引脚修复

当晶粒间链路上没有有效的流量时,就会执行测试和修复。修复完成并且链路初始化后,就会被认定链路质量良好,数据流可以正常通过。生成的PHY配置称为PHY修复签名,存储在链路两端的内部寄存器中。

由于老化或其他原因,在运行过程中微凸焊点特性的退化可能会影响链路性能。在协议级别上可以通过比特误码率(BER)的增加检测到,或者最坏的情况是通过数据丢失检测到。在这种情况下,该链路预计将中断,并执行新的测试和维修步骤。

然而,一些应用对晶粒间链路上的流量连续性有严格的要求-它们不能容忍在运行期间中断流量。对于这些情况,可测试性解决方案将信号完整性监控器(SIM)添加到每个UCIe接收器引脚。

晶粒

△图2:UCIe链路的运行状况监控解决方案。

信号完整性监控器

SIM监控器是嵌入在接收端的小模块。在正常运行期间,它们不断感测接收端引脚处的信号,以识别可能会影响链路性能或表明链路不健康且可能会在不久断开的信号特性的变化。

将各个传感器收集的数据收集在接口外部的监控、测试和维修(MTR)控制器中,以供进一步处理。聚合来自多个UCIe链路的数据可以即时洞察多晶粒系统的运行状况,并实现链路的预测性维护。

如果通过此程序预测特定链路存在故障风险,则可以禁用该链路,并利用UCIe PHY修复机制将数据重新路由到其中一个备用链路,这样可以实现没有流量中断。

加快唤醒时间

虽然大多数晶粒间接口用例的流量模式(例如在服务器拆分或扩展中)在运行期间被认为是稳定的,但在某些用例中却可能会表现出突发行为。在这种情况下,期望将接口带入低功耗模式以在没有流量的情况下节省电力。链路重新初始化可以通过避免测试和修复过程,并依赖在上一次PHY初始化期间创建的UCIe PHY修复签名来加速。

这一概念可以进一步扩展到晶粒完全断电的情况。在这种情况下,从PHY检索到修复签名并存储在片上永久存储器(eFuse of flash)上。该存储器可存储多个签名,涵盖不同的用例或条件,从而实现额外的用户灵活性。

使用UCIe加速晶粒测试

测试时间非常宝贵。通过分层划分测试策略以并行运行不同晶粒的测试,可以缩短测试时间。通过分层连接两个晶粒的测试基础设施,可以在多晶粒系统中跨多个晶粒扩展层次结构。这种方法允许从主晶粒中的单个JTAG(或类似)测试接口访问多晶粒系统中的所有晶粒。

通常,测试时间的限制是将测试向量加载或读取到晶粒中的时间。JTAG接口可能成为速度瓶颈。为了克服这一限制,设计人员可以使用现有的高速接口[如PCI Express (PCIe)或USB等]作为测试设备的接口。测试向量和命令针对该接口进行打包,并在生产测试阶段在晶粒上进行解包。

许多晶粒没有高速接口,但是在测试期间,UCIe晶粒间接口可用于以很快的速度在晶粒间传输大型测试向量和命令。UCI晶粒间接口可在整个多晶粒系统中扩展高速DFT访问,而不会增加引脚数量,这对IO和面积都有限制的晶粒非常重要。

总结

除了UCIe晶粒间接口外,支持所有这些测试和可靠性增强功能的共同点是可以连接所有内部模块的测试、修复和监控结构。测试、维修和监控结构跨越多晶粒系统中的各种晶粒,提供结构化的分层基础设施,实现以下重要功能:

1.管理多晶粒系统中各个晶粒的测试

2.优化测试计划以缩短测试时间

3.通过UCIe接口支持跨晶粒的高速测试访问

4.从UCIe接口中嵌入的运行状况监控接口收集信

息,并实现进一步的系统级处理

5.管理非易失性存储器中PHY修复签名的存储

6.以及其它功能

Synopsys提供全面且可扩展的多晶粒系统解决方案(包括EDA和IP),以实现快速异构集成。为了实现安全可靠的晶粒间连接Synopsys提供完整的UCIe控制器、PHY和验证IP解决方案。作为Synopsys SLM 和测试系列的一部分,可提供完整的UCIe监控、测试和修复(MTR)解决方案以及STAR层阶系统(SHS)解决方案。MTR解决方案包括用于测量UCIe通道信号质量的信号完整性监控器、用于自测试的BIST以及用于冗余通道分配的修复逻辑,而SHS解决方案则作为支持行业标准IEEE 1687、IEEE 1149.1、IEEE 1838接口的连接结构。该完整解决方案可在硅生命周期的所有阶段对UCIe进行高效且高性价比的运行状况监测,这对多晶粒系统的可靠运行至关重要。

(本文章选自新思科技IP技术公告)

  审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分