通过神经网络方法加速钙钛矿太阳能电池器件表征

分享自：
通过神经网络方法加速钙钛矿太阳能电池器件表征

信息科学
纳米科学
期刊:Applied EnergyDOI:10.1016/j.apenergy.2025.125922
【点击此处】阅读全文、收藏及针对性提问
本研究的主要作者为赵新海（Xinhai Zhao，来自浙江白马湖实验室有限公司和新加坡国立大学机械工程系）和黄超鹏（Chaopeng Huang，来自浙江白马湖实验室有限公司和苏州大学功能纳米与软物质研究院），作为共同第一作者。合作者包括Erik Birgersson、Nikita Suprun、谭瑚奎（Hu Quee Tan）、张玉柔（Yurou Zhang）、蒋玉霞（Yuxia Jiang）、寿春晖（Chunhui Shou）、孙景松（Jingsong Sun，通讯作者）、彭军（Jun Peng，通讯作者）和薛汉松（Hansong Xue，通讯作者）。该研究以题为《Accelerating device characterization in perovskite solar cells via neural network approach》发表于《Applied Energy》期刊，于2025年4月24日在线发表。
本研究的学术背景属于新一代光伏器件——钙钛矿太阳能电池（Perovskite Solar Cells, PSCs）的器件表征与优化领域，具体结合了机器学习（Machine Learning）与人工智能神经网络（Artificial Neural Network, ANN）方法。钙钛矿太阳能电池，尤其是作为叠层电池顶电池时，是具有高转换效率潜力的下一代光伏器件。传统上，基于物理的光电模型（optoelectronic model）虽能精确模拟器件性能，但其计算成本高昂，涉及求解高度非线性的漂移-扩散方程组，一次完整的模拟耗时较长，这限制了其在快速器件表征、参数研究、灵敏度分析、损失分析和优化设计中的应用。近年来，机器学习在光伏领域展现出应用潜力，已有研究将其用于预测钙钛矿材料特性（如带隙、晶格参数）或器件效率。然而，先前工作存在改进空间：例如，输入参数往往不够全面（未充分包含载流子迁移率、态密度、能带位置等关键电子学参数）；数据集样本量有限或分布不够广泛；以及神经网络模型本身可能存在过拟合或优化不足的问题。因此，本研究旨在通过构建一个基于物理的、覆盖广泛参数空间的神经网络模型，来替代传统光电模型中的电子学部分，从而创建一个高速、可靠的“代理模型”（surrogate model），以加速平面p-i-n结构钙钛矿太阳能电池的器件表征、性能预测、损失分析和优化流程。研究的具体目标包括：开发能高效预测器件关键性能指标（如开路电压Voc、填充因子FF、光电转换效率PCE）以及各种复合损失（如辐射复合、肖克利-里德-霍尔复合、俄歇复合、界面复合）的神经网络模型；实现快速（秒级）的模型校准与参数提取；并将该模型应用于指导内部实验器件的优化，最终提升器件效率。
研究的工作流程系统而详细，主要包含以下几个核心步骤： 第一步：大样本数据集生成与准备。 研究首先基于一个成熟的物理光电模型（该模型整合了光学矢量矩阵方法和电子学漂移-扩散方程，并考虑了离子传输，但在后续数据收集中为简化假设离子迁移非主导且器件无滞后效应）来生成训练神经网络所需的大规模数据。研究设定了31个输入参数，涵盖了器件的关键电子学特性，如各层厚度、材料光学常数（折射率n、消光系数κ）、掺杂浓度、介电常数、导带/价带态密度、电子/空穴迁移率、载流子寿命、陷阱态能级、各种复合系数（辐射、SRH、俄歇）、界面复合速度以及工作温度等。输出参数包括Voc、FF、PCE以及在不同工作点（最大功率点MPP和开路条件OC）下的各种复合电流密度损失，共计14个输出。参数的取值范围基于作者先前工作并留有充足边界，以确保模型的普适性。为了获得分布均匀的训练数据，研究采用拉丁超立方采样（Latin Hypercube Sampling）方法生成了10万个样本作为训练数据集。对于数值跨越多个数量级的参数，采用对数尺度进行采样以保证覆盖范围的均匀性。此外，还生成了三个额外的数据集，每个包含1万个样本（但使用不同的随机种子），分别用作测试数据集A、验证数据集和预留测试数据集B。在数据生成后，进行了后处理：剔除了能带排列不匹配导致载流子传输受阻的样本，以及因数值问题（如收敛失败）无法得到有效电流-电压特性的样本。最终，训练集、验证集、测试集A和预留测试集B的有效样本量分别为54,374、5,407、5,416和5,479个。最后，对所有输入和输出数据进行了归一化处理，将其映射到[-1, 1]区间，以消除量级差异对训练的影响。 第二步：神经网络架构设计与训练策略制定。 研究设计了三个独立的三层前馈神经网络（分别记为神经网络A、B、C），它们共享相同的31维输入，但输出不同：神经网络A预测器件性能（Voc, FF, PCE）；神经网络B预测在最大功率点（MPP）下的各种复合损失；神经网络C预测在开路（OC）条件下的各种复合损失。这种分离设计有利于针对性地进行模型校准（仅需神经网络A）和深入的损失分析（结合神经网络B和C）。神经网络的训练在MATLAB环境中进行，采用贝叶斯正则化（Bayesian Regularization）反向传播算法，该算法能自动调整权重和偏置，有效处理非线性回归并有助于防止过拟合。研究固定了训练、验证和测试集（测试集A），并使用独立的预留测试集B来最终评估模型性能。训练时设置了1000个epoch，并采用了早停法（early stopping），当验证集误差连续10次迭代上升而训练集误差下降时停止训练，以防止过拟合。 第三步：超参数优化。 为了获得最佳性能的神经网络，研究采用贝叶斯优化（Bayesian Optimization）来搜索最优超参数组合。优化的超参数包括：三个隐藏层的神经元数量（搜索范围2到100）、各隐藏层的传递函数（从tansig、radbas、logsig、purelin中选择）、初始学习率、最小梯度和动量。优化过程以训练均方误差（MSE）为目标函数，设置了最多10^4次迭代或7天运行时间的终止条件。作为对比，研究也尝试了传统的回归模型（如精细决策树、交互线性回归、三次支持向量机SVM和各向同性Matern 5/2高斯过程回归GPR），并对SVM和GPR模型进行了贝叶斯超参数优化，以凸显神经网络方法的优势。 第四步：模型性能验证与速度评估。 训练完成后，使用预留测试集B评估各神经网络模型的预测精度，计算预测值与真实光电模型输出值之间的均方误差和相关系数。同时，在计算速度方面，对比了神经网络模型与传统光电模型完成相同数量（如1000次）模拟所需的时间。 第五步：模型校准与应用验证。 将训练好的神经网络A（结合光学模型形成完整的代理模型）应用于实际器件的校准。首先，选取了四篇文献中报道的、用于叠层电池的不同带隙钙钛矿子电池（A1-A4），从文献中获取其已知材料参数，并将少数未知的复合参数（如辐射复合系数brad、界面复合速度V_IV和V_V）作为拟合变量。采用粒子群优化算法，通过最小化归一化的Voc、FF、PCE实验值与模型预测值之间的均方误差，在约24秒内完成每个器件的参数校准。校准后，将得到的全套参数带回COMSOL中的完整光电模型，生成完整的I-V曲线，与实验曲线进行对比验证。进一步，利用神经网络B和C对校准后的器件进行损失分析，量化各复合通道的贡献比例。 第六步：支持内部实验器件表征与优化。 研究将模型应用于内部制备的三批次钙钛矿太阳能电池的表征。器件结构为FTO/SAM/钙钛矿/C60/SnO2/Ag。通过改变自组装单分子层（SAM，如ME-4PACz或ME-4PACz/MeO-2PACz混合物）和钙钛矿/C60界面的钝化剂（如PMMA/PC61BM或PEABr/MABr），制备了不同带隙（1.56 eV和1.63 eV）的冠军器件（B1-B5）。使用神经网络A对这些冠军器件进行快速校准，提取其物理参数。基于校准结果和神经网络B/C的损失分析，识别限制性能的主要复合损失通道。最后，以校准后的冠军器件为基线，使用代理模型结合粒子群算法，在约28秒内对界面复合速度等关键参数进行优化，预测在最小化界面复合情况下的理论极限效率。
研究取得了一系列重要结果： 在模型性能方面： 经过贝叶斯优化得到的神经网络A、B、C均表现出优异的预测能力。在预留测试集B上，神经网络A预测Voc、FF、PCE的均方误差低至3.1×10^-4，相关系数接近1。具体而言，95%的训练数据和94%的测试数据对Voc的绝对误差≤0.01 V；对FF和PCE的预测也高度准确。神经网络B（预测MPP损失）和C（预测OC损失）的测试MSE分别低于4×10^-4和4×10^-5，相关系数同样极高。相比之下，尝试的四种传统回归模型（决策树、线性回归、SVM、GPR）的测试MSE在1.8×10^-3到8.3×10^-2之间，显著高于神经网络，且对于FF和PCE的预测存在较大偏差，GPR模型还出现了明显的过拟合现象。这证明了针对此类高度非线性的复杂系统，三层神经网络结合贝叶斯正则化和优化超参数的方法具有显著优势。 在计算效率方面： 神经网络模型展现出惊人的速度优势。完成1000次模拟，向量化后的神经网络仅需约0.3秒（墙钟时间），而非向量化也仅需约4.5秒。相比之下，使用COMSOL求解完整光电模型进行1000次模拟则需要约4800秒。因此，神经网络模型的加速比超过一千倍。基于此，模型校准时间从传统方法需要的约3天缩短至约24秒，器件优化时间也仅需约28秒。 在模型校准与验证方面： 对四个文献报道的器件（A1-A4）的校准均取得了成功，校准MSE介于10^-8到10^-6之间，预测的Voc、FF、PCE与实验值高度吻合。将校准后参数代入完整模型生成的I-V曲线与实验曲线对比，整体符合良好，尽管在最大功率点附近存在微小差异，这验证了代理模型的可靠性。损失分析结果表明，对于宽带隙（1.75 eV, 1.79 eV）器件A1和A3，界面复合（特别是界面V）是主要损失通道；而对于窄带隙（1.22 eV, 1.25 eV）器件A2和A4，体复合（辐射复合）的影响更为显著。这为针对不同带隙器件的优化提供了明确方向。 在指导内部实验方面： 模型成功应用于内部制备的冠军器件B1-B5的校准与分析。对于1.56 eV带隙器件：比较B1（PMMA/PC61BM钝化）和B2（PEABr/MABr钝化），损失分析证实PEABr/MABr能更有效地降低界面V的复合，使PCE从22.9%提升至24.7%。以B2为基线进行优化，预测通过最小化界面IV和V的复合，理论极限PCE可达28.9%。对于1.63 eV带隙器件：比较B3（单一SAM）和B4（混合SAM），校准表明混合SAM提高了空穴传输层的功函数，改善了能级对齐，从而提升了FF和PCE。比较B4（PMMA/PC61BM钝化）和B5（PEABr/MABr钝化），后者因界面V复合大幅降低，使得Voc和PCE显著提升。以B5为基线优化，预测理论极限PCE为25.5%。这些分析不仅解释了实验观察到的性能差异（如使用PEABr/MABr钝化或混合SAM带来了约1.5%-2%的PCE实验提升），还为下一步的材料与工艺改进（如优化SAM材料或ETL界面钝化）提供了清晰的物理见解和目标。
本研究的结论是，通过用人工神经网络替代传统光电模型中的电子学部分，成功开发了一个用于平面p-i-n结构钙钛矿太阳能电池的高速代理模型。该模型能够高效、准确地预测器件性能和复合损失。采用均匀采样、对数缩放、数据归一化、贝叶斯正则化、早停法和贝叶斯优化超参数等一系列策略，训练出的神经网络测试误差低于4×10^-4，计算速度比传统模型快一千倍以上，使得器件表征可在约24秒内完成。该模型已成功应用于文献器件和内部实验器件的校准、损失分析和优化，通过解决关键的界面复合问题，在实验中观察到了约2%的PCE提升，并预测了1.56 eV和1.63 eV带隙器件的理论极限效率分别为28.9%和25.5%。这种将快速建模与实验迭代结合的能力，使该模型成为推动钙钛矿太阳能电池研发、迈向数字孪生（Digital Twins）应用的宝贵工具。
本研究的亮点在于：第一，方法创新： 首次构建了一个整合全面电子学参数（31个输入）、基于物理机制的大规模数据集，并训练了专门针对钙钛矿太阳能电池性能与损失分析的三组神经网络，形成了一个完整、高效的“代理模型”工作流程。第二，性能卓越： 所开发的神经网络模型在预测精度（MSE < 4×10^-4）和计算速度（加速>1000倍）上均取得了突破性进展，实现了秒级的模型校准与优化。第三，应用导向，价值显著： 研究不仅进行了模型验证，更深入地将其应用于指导实际实验，通过损失分析精准定位了性能瓶颈，解释了不同材料/工艺的效果，并预测了理论极限，实现了从“建模”到“用模”的闭环，展示了其在实际研发中的巨大应用潜力。第四，前瞻性： 论文还探讨了模型的扩展性，如应用于n-i-p结构、四端全钙钛矿叠层电池，以及未来整合离子迁移效应、稳定性分析和工艺优化的可能性，为后续研究指明了方向。
此外，研究在数据质量把控（如剔除不合理能带排列样本）、与传统机器学习方法的对比验证、以及详细的内部实验工艺描述等方面，都体现了工作的严谨性和完整性。附录和补充数据（Supplementary Data）的提供也增强了研究的可重复性和透明度。这项工作为钙钛矿光伏领域提供了一种强大的、变革性的器件表征与优化新范式。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问