本研究《Autoencoder for Parameter Estimation and Current-Voltage Curve Simulation of Perovskite Solar Cells》由Oliver Zbinden、Ennio Luigi Comi、Evelyne Knapp以及Wolfgang Tress四位研究人员共同完成,他们分别来自苏黎世应用科学大学(Zurich University of Applied Sciences)的计算物理研究所以及苏黎世大学(University of Zurich)的数学建模与机器学习系。该研究于2026年发表在学术期刊《npj Computational Materials》上。
本研究的科学领域集中在钙钛矿太阳能电池(Perovskite Solar Cells, PSCs)的器件物理与机器学习交叉领域。钙钛矿太阳能电池因其高效率(目前实验室认证效率已超过26%,硅-钙钛矿叠层电池甚至达到34.6%)、低成本及可调谐的优异光电性能而备受关注。然而,推动其效率和稳定性进一步提升面临重大挑战:许多决定器件性能的关键物理参数,如电子/空穴迁移率、载流子寿命、离子密度与迁移率以及界面复合速度等,在真实器件中难以甚至无法直接测量。这导致器件优化通常依赖“试错法”,耗费资源且缺乏物理层面的深刻理解。另一方面,电流-电压(J-V)曲线是器件制造过程中常规且易于测量的数据,其中隐含了丰富的物理信息。
因此,本研究的目标是开发一种基于机器学习的方法,能够从钙钛矿太阳能电池易于测量的J-V曲线中,快速、准确地提取那些难以直接测量的关键物理参数。其最终目的是深化对器件物理过程的理解,助力于器件性能诊断、制造工艺优化以及高效稳定器件的开发。机器学习,特别是自编码器(Autoencoders, AEs)及其变体,在材料发现和性能预测方面已有应用,但将其用于从J-V曲线直接逆向提取多物理参数,以服务物理理解,是本研究的核心出发点。
本研究的工作流程是一个结合了数值模拟、机器学习模型训练与实验验证的系统性闭环,主要包含以下几个步骤:
1. 数据集生成与准备: * 研究对象与样本量: 研究并未使用真实器件作为初始训练数据,而是利用一维漂移-扩散(1D Drift-Diffusion, DD)模型模拟生成海量“虚拟”钙钛矿太阳能电池的数据。研究模拟了两种工况下的器件:稳态(steady-state)和瞬态(transient)。每种情况都模拟了大约50万个虚拟器件,构成了庞大的训练、验证和测试数据集。 * 处理方法: 研究者首先基于Solaronix公司生产的碳电极介孔钙钛矿太阳能电池的典型结构(FTO/TiO2/m-TiO2-MAPI/m-ZrO2-MAPI/Carbon)和文献参数,在Setfos仿真软件中建立了一个基准器件模型。然后,围绕这个基准,系统地随机改变了六组(瞬态为七组)关键物理参数,这些参数被选中是因为它们易受材料变化或降解影响,且能代表不同的物理效应(如体相传输vs.复合、界面复合、离子效应)。这些参数及其变化范围(基于物理合理性设定,范围较宽以涵盖从高性能到完全退化的各种情况)包括:电子/空穴迁移率(μ)、电子/空穴在TiO2-钙钛矿界面的表面复合速度(s)、电子/空穴的有效Shockley-Read-Hall寿命(τ)、TiO2层中的电子迁移率(μ_tio2)、阴/阳离子密度(ρ_ion),以及仅在瞬态模拟中额外变化的阳离子迁移率(μ_c)。 * 模拟实验设置: 稳态模拟在0.1至1个太阳光照强度下进行;瞬态模拟则在恒定1个太阳光照下,以一系列扫描速度(0.005, 0.05, 0.5, 5, 50, 100 V/s)进行正向和反向电压扫描,扫描速度按降序排列以模拟实际测量条件。每个虚拟器件的输出是针对不同光照或不同扫描速度的一系列J-V曲线数据。
2. 机器学习模型开发与训练: * 算法与创新方法: 研究团队采用了一种经过特殊设计的条件自编码器(Conditional Autoencoder)。与标准自编码器仅学习压缩和重建数据不同,该模型在损失函数中加入了关键约束:不仅要求解码器(Decoder)能够从潜在空间(Latent Space)重建出输入的J-V曲线,还要求编码器(Encoder)输出的潜在变量必须尽可能地接近模拟时使用的真实物理参数值。这相当于在训练过程中,将潜在空间的维度与物理参数的数量对齐,并强制潜在变量具有明确的物理意义。研究者比较了标准AE、变分自编码器(VAE)和条件VAE,最终选择了这种定制化的条件AE,因为它在参数估计精度和J-V曲线重建能力之间取得了最佳平衡,且训练效率较高。 * 模型架构与数据处理: 编码器和解码器采用对称结构,包含卷积层和全连接层。卷积层的引入有助于平滑实验数据中可能存在的噪声。输入的J-V曲线数据(电流值)经过插值、归一化等预处理后,被送入模型。模拟的物理参数则进行对数归一化。数据集按70:15:15的比例划分为训练集、验证集和测试集,并进行了10折交叉验证以确保模型稳健性。
3. 模型评估与参数估计验证: * 内部验证(对模拟数据): 在训练完成后,首先在未见过的测试集上评估模型性能。评估包括两方面:一是检查解码器重建的J-V曲线与原始模拟J-V曲线的吻合程度(通过R²分数和电压分辨的残差分析);二是直接比较编码器预测的物理参数值与模拟时设定的“真实”参数值。研究者计算了各参数的R²值和F0.2分数(预测残差绝对值小于0.2的比例),以量化估计精度。 * 外部验证(对真实实验数据): 这是验证方法实用性的关键步骤。研究团队测量了四个真实的封装介孔钙钛矿太阳能器件(来自Solaronix,分属两个批次:A1, A2效率较低约9%;B1, B2效率较高约11%)在不同扫描速度下的瞬态J-V曲线。将这些实测曲线输入训练好的编码器,得到一组物理参数估计值。然后,使用这些估计值作为输入,重新运行耗时的1D漂移-扩散模拟(“再模拟”),并将再模拟得到的J-V曲线与实测曲线进行对比。同时,也将编码器估计的参数直接输入解码器,获得近乎瞬时的J-V曲线预测,并与实测和再模拟结果比较。
1. 模型在模拟数据上的表现: * J-V曲线重建: 解码器能够极好地重建J-V曲线,稳态和瞬态模型的J曲线重建R²分别高达0.996和0.988,表明解码器可以作为原始模拟器的一个高速“代理模拟器”。 * 参数估计精度: 编码器对大多数物理参数的估计表现出色,但精度因参数而异。 * 高精度参数: 电荷载流子迁移率(μ)和离子密度(ρ_ion)的估计精度最高,R²接近1(μ:稳态0.980,瞬态0.984;ρ_ion:稳态0.996,瞬态0.859)。这表明J-V曲线对这些参数的变化非常敏感,且AE能够有效捕捉这种依赖关系。 * 中等精度参数: 载流子寿命(τ)和表面复合速度(s)的估计具有良好但稍低的精度(τ的R²约0.9,s的R²稳态0.911,瞬态0.500)。分析表明,当这些参数的值非常小(s)或非常大(τ)时,它们对J-V曲线的影响趋于饱和,变得不敏感,导致在这些区域的估计误差增大。 * 较低精度参数: TiO2层电子迁移率(μ_tio2)的估计挑战最大(R²稳态0.721,瞬态0.351)。这归因于其在器件中作用的复杂性,涉及电荷提取、界面复合和电场分布等多种相互交织的效应。 * 阳离子迁移率(μ_c): 作为瞬态特有的参数,其估计精度很高(R²=0.961),验证了该方法能够从动态J-V曲线中提取离子迁移信息。 * 参数相关性分析: 残差的相关矩阵显示参数间的相互依赖性较弱,表明模型能够相对独立地估计各参数。尝试进一步压缩潜在空间(例如用离子电导率σ_c代替μ_c和ρ_c)会导致精度下降,证实了当前参数设置的合理性。
2. 模型在真实器件上的应用验证: * 解码器作为快速模拟器: 解码器生成J-V曲线的速度比传统DD模拟快四个数量级(20-30毫秒 vs. 250-400秒),展现了其作为实时或高通量分析工具的潜力。 * 参数估计与验证: 对于四个实测器件,编码器给出了具体的参数估计值。使用这些参数进行DD再模拟得到的J-V曲线,与解码器的预测高度一致,这验证了编码器-解码器系统内部的自洽性。然而,再模拟/解码器预测的曲线与实测曲线之间存在一些偏差,特别是在存在明显滞后(hysteresis)时。这种偏差可能源于仿真模型未完全捕获真实器件中的所有物理过程(例如介孔层中复杂的离子-电子相互作用,或模型中假设阴离子静止)。 * 模型修正与物理洞察: 以器件A1为例,研究者基于AE提供的参数估计作为起点,通过手动微调少数参数(如降低μ_tio2和τ),显著改善了仿真与实测数据的一致性。这证明了AE估计能为耗时的手动拟合提供极佳的初始点。此外,从编码器提取的阳离子迁移率(μ_c)估计值显示,效率较低的A1、A2器件的μ_c低于效率较高的B1、B2器件,这一趋势与通过瞬态电致发光测量观察到的离子迁移快慢趋势定性一致,交叉验证了编码器作为参数提取工具的可靠性。
本研究成功开发并验证了一种基于条件自编码器的机器学习框架,能够仅从钙钛矿太阳能电池的电流-电压(J-V)曲线中,快速、自动地估计多个关键且难以直接测量的物理参数。该方法创造了一个“编码器-解码器”系统:编码器充当“参数提取器”,可在秒级时间内从J-V曲线推断器件物理参数;解码器充当“高速代理模拟器”,能基于给定参数瞬间生成J-V曲线。
其科学价值在于为钙钛矿光伏研究提供了一种强大的逆向分析工具,将易于获取的表征数据(J-V曲线)与深层次的器件物理参数联系起来,从而有助于深入理解效率损失机制、降解过程以及不同制造工艺的影响。应用价值则体现在多个层面:在研发中,可加速器件物理分析,减少对耗时参数测量的依赖;在工业生产中,可用于高通量器件筛查和质量控制,快速识别性能不佳的器件。
研究公开了生成的数据集和代码,体现了研究的可重复性和开放性。同时,作者也坦诚讨论了当前方法的局限性:例如,解码器的有效性受限于训练数据所基于的特定器件架构和仿真模型;方法提供的是点估计,未包含不确定性量化;不同参数组合可能导致相似的J-V曲线(简并性)。这些为未来工作指明了方向,例如引入变分自编码器进行不确定性估计,或将方法扩展到更多样的器件结构和参数。