本文研究发表于2021年2月的IEEE Journal of Emerging and Selected Topics in Power Electronics期刊上。研究由来自重庆大学和英国华威大学的研究人员Borong Hu、Sylvia Konaklieva、Nadia Kourra、Mark A. Williams、Li Ran和Wei Lai共同完成。该研究属于电力电子器件可靠性与寿命预测领域。
绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor, IGBT)功率模块广泛应用于可再生能源和电网系统中。在这些应用场景中,模块通常承受幅度较低(如30-40°C)但持续数十年的温度循环应力。传统的加速寿命测试(Accelerated Lifetime Testing, ALT)使用高应力条件(例如温度变化范围超过100°C)来快速评估器件寿命,但这与实际运行中的低幅值、长期应力条件存在显著差异。从工程应用的角度看,理解在这种低应力循环下的缓慢老化过程至关重要。先前的研究已表明低应力循环对已老化模块的影响不可忽视,但关于一个全新模块如何在长期运行中从初始状态逐渐老化直至失效,其微观机理尚不清楚,这阻碍了构建更为完整的寿命预测模型。此外,在芯片焊接层中,由于制造工艺原因,不可避免地存在初始微孔洞(Void)。这些孔洞的存在及其在热机械应力下的演化行为是影响模块长期可靠性的关键因素。因此,本研究旨在探究在实际运行的低幅值热机械应力循环下,IGBT模块芯片焊接层中初始孔洞和裂纹的演化机理,并建立相应的寿命预测模型。
本研究采用了实验表征、有限元模拟和物理失效建模相结合的综合研究方法,工作流程主要包含以下几个环节。
首先,计算机断层扫描(Computed Tomography, CT)成像与缺陷表征实验。研究使用蔡司Xradia 520型号的CT扫描仪(体素分辨率7.8 μm)对商业IGBT模块(型号SKM50GB12T4)的芯片焊接层进行无损成像。研究对象包括新的模块和经过特定功率循环老化后的模块。样本量为一个模块,但扫描了其内部的多个区域以统计孔洞。研究人员对同一模块在老化前(新模块)和老化后(经受35,000次功率循环,结温波动ΔTj=17.5°C,平均结温Tj,mean=68°C)分别进行了CT扫描,获取了高分辨率的3D图像。通过Avizo软件处理多层扫描图像,识别并量化了焊接层中数百个孔洞。测得的参数包括每个孔洞的体积、表面积,并假设其为理想球体计算出等效半径。这种方法能够定位单个孔洞,并追踪其在老化前后的尺寸变化。特别是,研究详细展示了三种典型缺陷的演化:焊接层内部的孔洞、靠近芯片-焊接边界的孔洞,以及已存在于边界上的微小裂纹。通过颜色编码图像(根据孔洞体积大小)和定量图表(如孔洞半径分布图、生长率图),直观和定量地揭示了低幅值应力循环确实能导致微孔洞的生长和边界裂纹的形成,尽管此时宏观热阻尚未发生可测变化。
其次,功率循环测试与宏观参数监测。研究搭建了功率循环测试电路,对多个IGBT模块样本进行测试。测试主要分为两种目的:一是为了验证低幅值循环本身能导致微观缺陷演化(如前所述,与CT扫描配合);二是为了获取裂纹扩展与宏观性能退化(热阻增加)之间的关系,用于验证后续的物理失效模型。对于后者,研究人员设计了一种多阶段测试策略:首先对模块施加高应力ALT循环(ΔTj=118°C)以人为制造可测量的初始裂纹和热阻小幅上升;然后转为施加低幅值应力循环(类似于实际运行条件),观察并记录在低应力下热阻的缓慢增长过程。在此过程中,通过精确控制的小电流(100 mA)测量饱和压降Vce来推算结温,进而计算结-壳热阻(Rth)。通过监测归一化热阻随循环次数的变化,可以反推出裂纹的平均扩展速率,为模型验证提供关键数据。实验涉及多个模块样本,分不同组别进行不同温度条件的测试。
第三,有限元分析与物理失效建模。这是本研究的核心模拟部分。研究人员基于商业软件COMSOL Multiphysics建立了2D轴对称模型,模拟单个IGBT芯片及其封装结构(包括硅芯片、SAC305焊料层、DBC陶瓷基板、铜基板等)。材料参数均采用文献中的真实数据,其中SAC305焊料采用Anand粘塑性本构模型,以准确描述其在温度循环下的应力-应变迟滞行为。模型经过校准,其计算的瞬态热阻抗曲线与器件数据手册吻合良好,验证了模型的热学准确性。研究的创新点在于将缺陷生长模拟集成到有限元分析(Finite-Element Analysis, FEA)中。在模型中,预设不同位置(内部、边界)和尺寸(半径2-50 μm)的孔洞或初始裂纹。然后,对模型施加与实际功率循环相对应的脉冲热源(频率0.1 Hz,对应ΔTj=17.5°C)。FEA计算每个应力循环下,缺陷周围的冯·米塞斯应力和累积的非弹性应变。基于Coffin-Manson疲劳失效模型(方程式:Δε_in * N_f^α = C,其中Δε_in为每循环非弹性应变幅,N_f为失效循环数,α和C为材料常数),计算局部材料的寿命消耗。通过一种动态元素移除算法,模拟缺陷的生长:在每个模拟循环后,根据累积寿命消耗对有限元网格中的元素进行排序,移除已达到失效判据的元素(即材料失效),从而更新缺陷的几何形状,然后进行下一个循环的应力应变计算。这种方法可以物理地模拟孔洞如何扩展、何时触及边界、如何转变为裂纹以及裂纹如何沿边界扩展的动态过程。
第四,模型验证与长期寿命评估。将模拟结果与实验数据进行多层次对比验证:1)将模拟预测的不同初始尺寸孔洞在35,000次循环后的半径增长率与CT测量结果对比,两者趋势吻合良好,验证了孔洞生长模型的准确性。2)将基于裂纹扩展模型计算出的、在不同应力水平下导致1微米裂纹扩展所需的循环次数,与实际功率循环测试中测量的扩展速率进行对比。同时,将这些数据点与同种焊料材料的加速寿命测试数据(Δε_in 与 N_f 关系曲线)绘制在同一图中,结果显示模拟和实验数据点均落在材料疲劳曲线的合理范围内,从而交叉验证了裂纹扩展模型的物理正确性。在模型得到验证的基础上,研究最后进行了一个应用案例研究:评估一个用于11千伏配电网的“软开关点”(Soft-Open-Point, SOP)变流器中的IGBT模块寿命。研究者假设了电网负载波动导致的结温循环条件(ΔTj=17.5°C, Tj,mean=68°C,每小时波动4次),并基于已验证的模型,模拟了不同初始缺陷状态下模块的寿命。通过时间尺度转换(将循环次数转换为实际运行年数),给出了从初始缺陷发展到最终失效(定义为热阻上升至初始值的1.2倍)的时间预估。
CT实验结果显示,经过35,000次低ΔTj功率循环后,芯片焊接层中几乎所有的初始微孔洞都发生了尺寸增长。统计表明,较小尺寸的孔洞(如半径约10 μm)具有相对更高的体积和面积增长率。更重要的是,CT图像清晰地揭示了三种演化路径:1)位于焊料层内部的孔洞在循环后体积增大;2)靠近芯片-焊接边界的孔洞生长并与芯片接触,演变为边界裂纹;3)已存在的微小边界裂纹在循环后进一步扩展。这些直观证据首次明确了在实际运行应力水平下,微观缺陷确实会持续演化,为“缓慢老化”过程提供了直接观测依据。
有限元模拟结果深入揭示了缺陷演化的力学机理。对于内部孔洞,应力集中主要出现在孔洞的上下边缘,且上边缘(靠近芯片侧)应力更高,这导致孔洞倾向于垂直向上生长。模拟发现,存在一个“最危险”的初始孔洞尺寸(半径约10 μm),其承受的应力和累积的非弹性应变最大,因此生长速率最快。这是因为过小的孔洞受周围材料约束强,应力集中有限;而过大的孔洞曲率半径大,应力集中效应减弱。这一发现与实验中观察到的“小孔洞增长更快”的趋势一致。对于已附着在芯片-焊接边界的孔洞,模拟显示应力高度集中在孔洞与边界相接的“角落”处,此处的非弹性应变积累将直接诱发裂纹,并使其向焊料层内部延伸。裂纹一旦形成,其扩展特性与内部孔洞有本质不同。
裂纹扩展的模拟得出了关键结论:在芯片-焊接边界萌生并沿边界扩展的裂纹是最危险的失效模式。模拟显示,裂纹尖端的应力集中因子远高于无缺陷状态,且随着裂纹长度的增加,尖端应力及非弹性应变幅值非但不减缓,反而因热阻上升导致结温升高而加剧,形成正反馈。这意味着裂纹扩展具有渐进加速的特性。这一机理成功地解释了功率循环实验中观察到的现象:在热阻开始可测量上升后,其增长速度会逐渐加快。
模型验证结果证实了上述物理模型的可靠性。孔洞生长速率的模拟与测量值相符。裂纹扩展模型预测的“导致单位长度扩展所需循环次数”与不同应力水平下的实验测量值高度相关,并且这些数据点与SAC305焊料的基准疲劳曲线吻合,实现了从微观力学模拟到宏观实验现象、再到材料本征属性的贯穿验证。
基于验证模型的长期寿命评估案例给出了量化预测。在假定的SOP运行条件下,研究比较了三种初始状态:1)理想无缺陷焊层:裂纹从边缘萌生并扩展至失效,预计寿命约90年。2)焊层中心存在一个单孔洞:需要约50年时间生长至边界并形成裂纹,再经若干年扩展至失效。3)边界已附着孔洞(最差情况):可直接快速诱发裂纹,预计寿命可能低于25年。这凸显了初始缺陷(尤其是位于边界处的缺陷)对模块实际服役寿命的巨大影响。
本研究得出结论:在可再生能源和电网应用典型的低幅值温度循环下,IGBT功率模块芯片焊接层的长期可靠性严重依赖于初始缺陷的状态和演化。孔洞可能首先在应力作用下生长并转化为边界裂纹,而边界裂纹的扩展是导致最终热失效的关键过程,且其扩展速率是渐进加速的。一个完整的寿命评估模型必须考虑初始缺陷的分布和具体应用的应力特性。
本研究的科学价值在于,首次系统地将微观CT实验观测、基于物理的有限元模拟和疲劳失效模型相结合,清晰地阐明了在实际运行应力条件下,功率模块封装从微观缺陷萌生、演化到宏观性能退化的全链条机理。它弥补了传统ALT高应力模型与实际低应力老化之间的认知鸿沟。
其应用价值显著:1)为电力电子系统设计师提供了基于物理的、更贴近实际工况的器件寿命评估工具和方法,有助于在系统设计阶段进行更精确的可靠性预估。2)研究结果明确指出,位于芯片-焊接边界的初始缺陷危害性最大,这为器件制造和封装工艺的改进提供了明确方向,例如通过优化工艺来减少边界处的孔洞。3)研究框架本身具有可扩展性,可应用于评估其他封装材料、新型器件(如SiC模块)或不同应用场景的可靠性。