基于集成机器学习模型预测混凝土-木材填充钢管力学性能的研究报告
一、 作者、机构与发表信息
本研究的主要作者为 F. Kazemi, N. Asgarkhani, T. Ghanbari-Ghazijahani 和 R. Jankowski。F. Kazemi 和 N. Asgarkhani 的所属机构包括波兰格但斯克理工大学(Gdańsk University of Technology)土木与环境工程学院以及希腊雅典国立理工大学(National Technical University of Athens)土木工程学院。T. Ghanbari-Ghazijahani 来自澳大利亚麦考瑞大学(Macquarie University)工程学院,R. Jankowski 则隶属于波兰格但斯克理工大学土木与环境工程学院。该研究作为一篇学术论文,发表于期刊《Engineering Applications of Artificial Intelligence》第156卷(2025年),文章识别号为111234,于2025年6月4日在线发布。
二、 学术背景与研究目的
本研究的科学领域属于土木工程材料与结构工程,具体聚焦于复合材料构件(混凝土-木材填充钢管,CTFST)的力学性能预测,并交叉应用了先进的计算方法学,特别是机器学习(ML)。
研究背景与动机:混凝土-木材填充钢管(CTFST)作为一种新型复合结构构件,因其结合了钢材、混凝土和木材的优点(如高承载力、良好的能量吸收和延性),在可持续和高性能建筑中展现出巨大潜力。然而,由于三种材料相互作用的复杂性,准确预测CTFST的力学行为(如荷载-位移曲线、应力-应变曲线、最大轴向承载力和弹性刚度)是设计过程中的主要挑战。传统上依赖大量实验和有限元(FE)分析,成本高且耗时。尽管已有研究利用机器学习预测传统混凝土填充钢管(CFST)的性能,但针对CTFST,尤其是预测其完整力学曲线(而不仅仅是单一强度指标)的可靠机器学习模型尚属空白。同时,现有ML研究多基于传统单一模型,在处理CTFST这类复杂、数据量可能有限的问题时,其泛化能力和适应性存在不足。
研究目的:因此,本研究旨在开发一种基于集成机器学习(Ensemble Machine Learning)的先进预测框架,以准确估计CTFST的力学性能,特别是其完整的轴向荷载-位移曲线和应力-应变曲线,以及关键设计参数(最大轴向承载力和弹性刚度)。最终目标是提供一个经过实验验证的、用户友好的图形用户界面(GUI)工具,用于CTFST构件的初步评估,从而减少对昂贵实验的依赖,优化设计流程。
三、 详细研究流程
本研究包含一个系统且多阶段的工作流程,主要可分为以下几个关键步骤:
1. 数据准备与数值建模: * 研究对象与样本量:研究的基础数据来源于Azandariani等人(2021)通过ABAQUS软件建立的88个CTFST有限元模型。这些模型涵盖了不同的几何参数(如钢管直径D、径厚比D/t)和材料属性(木材、混凝土、钢材的横截面积At、Ac、As及木材抗压强度ft),旨在探究CTFST在轴向压缩下的力学响应。 * 模型处理:模型中,钢材采用遵循von-Mises屈服准则的运动硬化模型;木材采用具有理想化单轴应力-应变关系的弹塑性本构模型;混凝土采用合适的本构关系。部件间的相互作用采用法向“硬接触”和切向“罚函数摩擦”进行模拟。通过非线性分析,从这些FE模型中提取了轴向荷载-位移曲线,进而衍生出其他力学性能数据。 * 数据集构建:基于FE分析结果,构建了四类数据集用于训练和测试不同的ML模型目标:(a) 最大轴向承载力,(b) 弹性刚度,© 轴向荷载-位移曲线,(d) 轴向应力-应变曲线。其中,针对最大轴向承载力和弹性刚度,为了增强模型在小样本下的鲁棒性,研究采用了合成数据生成技术(变分自编码器VAE和生成对抗网络GAN)将原始数据点扩充至1000和2000个。所有数据集均进行了预处理(如清洗、转换)并采用80%-20%的比例划分训练集和测试集,同时应用了K折交叉验证以确保模型评估的稳健性。
2. 机器学习模型开发与优化: * 模型选择:研究评估了32种传统ML算法,最终选取了五种表现优异的作为基础学习器:极限梯度提升(XGBoost)、梯度提升机(GBM)、自适应提升(AdaBoost)、随机森林(RF)和装袋回归(BR)。在此基础上,构建了五种不同的并行集成ML模型(Ensemble ML-1 至 Ensemble ML-5),每种均由不同的基础学习器组合而成(例如,Ensemble ML-1结合了BR、XGBoost和GBM)。 * 超参数优化:为了提升模型性能,研究对传统ML和集成ML模型均进行了超参数调优。研究首先对包括粒子群优化(PSO)、遗传算法(GA)、贝叶斯优化(BO)等在内的多种优化算法进行了初步评估。结果表明,PSO和GA在优化RF模型时取得了最佳精度(分别为93.2%和92.4%),因此被选定用于后续所有集成ML模型的超参数优化。这些优化算法通过高效搜索超参数空间,平衡探索与利用,确保了模型获得最优配置。 * 集成策略:集成模型采用并行执行方式,聚合各基础学习器的预测结果,以期通过多样性结合来降低方差、提高预测准确性和泛化能力。
3. 模型训练、验证与性能评估: * 训练与测试:使用准备好的数据集(包括原始FE数据和合成数据)对上述十种ML模型(5种传统+5种集成)进行训练和测试。 * 性能指标:采用一套全面的统计指标来量化模型性能,包括决定系数(R²)、均方误差(MSE)、平均绝对误差(MAE)、平均绝对相对误差(MARE)等共九项指标(详见表3)。这些指标从不同角度衡量了模型的预测精度、误差大小和一致性。 * 曲线拟合能力验证:除了对单一数值目标(承载力、刚度)的回归预测,研究特别测试了ML模型对完整力学曲线(荷载-位移、应力-应变)的拟合与预测能力。将部分FE模型曲线作为“未见过的”测试数据,输入训练好的模型,观察其预测曲线与真实曲线的吻合程度。
4. 基于实验数据的模型泛化验证: * 验证对象:为了检验模型在真实物理试验中的泛化能力,研究采用了Ghanbari-Ghazijahani等人(2017)进行的12个CTFST试件的实验数据作为独立的验证集。这些试件包含圆形、矩形、方形和带圆角方形四种不同形状的木材内芯。 * 验证过程:使用之前基于圆形木材芯CTFST FE数据训练的ML模型,来预测这些不同形状试件的力学曲线和性能参数。对于非圆形截面,将其木材面积转换为等效圆形面积作为模型输入。通过比较ML预测曲线与实验曲线,以及预测的承载力/刚度与实验值,评估模型的实用性和可靠性。
5. 图形用户界面(GUI)工具开发: * 基于验证有效的集成ML模型,研究开发了一个用户友好的GUI工具。该工具允许用户输入CTFST的几何与材料参数,即可快速预测其轴向荷载-位移曲线、应力-应变曲线、最大轴向承载力和弹性刚度,并可视化结果。GUI还预留了未来扩展数据库和更新模型的功能。
四、 主要研究结果
1. 最大轴向承载力预测结果: * 在所有数据集(GAN生成1000/2000点,VAE生成1000/2000点)上,所有ML模型的预测R²值均高于98.2%,显示出极高的整体预测精度。 * 通过比较详细的误差指标(MSE, MAE, MARE等),研究发现集成模型,特别是Ensemble ML-5、Ensemble ML-4和Ensemble ML-1,在大多数情况下表现出最低的误差和最稳定的性能。例如,在使用VAE生成的2000个数据点数据集上,Ensemble ML-5的R²高达0.999,而MAE和RMSE相对较低(表7)。这表明集成模型在估计CTFST最大轴向承载力方面比单一传统模型更可靠,尤其是在处理不同来源和规模的合成数据时泛化能力更强。
2. 弹性刚度预测结果: * 对于弹性刚度的预测,所有模型也取得了优异的结果,R²值均超过97.2%。 * 误差分析表明,Ensemble ML-3和Ensemble ML-5 是预测弹性刚度的最佳模型。它们在不同数据集上 consistently 保持了较低的误差水平(例如,表10、11)。这进一步证实了集成方法在捕捉结构刚度这类可能受多种因素非线性影响的属性方面的优势。
3. 轴向荷载-位移曲线拟合结果: * 研究选取了三个未参与训练的FE模型曲线(标本21、50、74)来测试模型的曲线拟合能力。结果显示,多个集成ML模型(如Ensemble ML-3, ML-4, ML-5)能够非常准确地预测曲线的弹性段、峰值荷载段乃至非线性下降段。 * 例如,对于标本50和74,Ensemble ML-3、ML-4和ML-5的预测曲线与“真实”FE曲线几乎完全重合(图12, 13)。这表明训练好的ML模型不仅能够输出单一数值,还能学习并复现复杂的非线性力学行为全过程,这对于理解构件失效机制和进行位移相关设计至关重要。
4. 轴向应力-应变曲线拟合结果: * 同样,在预测应力-应变曲线时(图14-16),集成ML模型(Ensemble ML-1至ML-5) 展现了全面捕捉曲线特征(包括弹性阶段、塑性平台和破坏阶段)的卓越能力,而部分传统模型仅能较好预测弹性部分。这凸显了集成模型在模拟更复杂材料本构关系方面的优越性。
5. 实验验证结果: * 将集成ML模型应用于真实的圆形木材芯CTFST(CT-CFST)实验试件,预测的荷载-位移曲线与实验曲线在弹性段和峰值荷载附近高度吻合(图20)。从预测曲线中提取的弹性刚度和最大轴向承载力与实验值对比显示误差很小。 * 对于CT-CFST-1试件,Ensemble ML-3预测弹性刚度的误差仅为0.57%,Ensemble ML-5预测最大承载力的误差为1.92%(表12, 13)。对于CT-CFST-2试件,误差也分别低至0.70%和0.72%。研究还提出,采用多个集成模型预测结果的平均值,可以进一步提高可靠性(平均误差约1-2%)。 * 更具挑战性的是,使用基于圆形木材芯数据训练的模型,去预测其他形状(方形ST-CFST、矩形RT-CFST、带圆角方形FT-CFST)木材芯试件的力学曲线。结果显示(图22-27),尽管存在一定偏差,但集成模型仍能较好地预测曲线的总体趋势和关键特征,尤其是弹性部分。这证明了模型具有一定的外推能力。研究指出,通过增加包含不同截面形状的训练数据,可以进一步提升此类预测的精度。
6. 性能对比与优势: * 综合所有结果,集成ML模型在绝大多数预测任务(数值回归和曲线拟合)上均优于或等同于最好的传统单一ML模型。其优势在于通过组合多个学习器,降低了过拟合风险,增强了模型的稳定性和对复杂、高维、非线性关系的捕捉能力。 * 研究还记录了模型的执行时间,虽然集成模型因包含多个子模型而耗时略长,但其带来的精度和可靠性提升被认为远超额外的计算成本,且在现代计算资源下是可接受的。
五、 研究结论与价值
本研究成功开发并验证了一套基于集成机器学习(Ensemble ML)的先进框架,用于准确预测混凝土-木材填充钢管(CTFST)的关键力学性能,包括完整的轴向荷载-位移曲线、应力-应变曲线、最大轴向承载力和弹性刚度。
科学价值: 1. 方法学创新:首次将集成机器学习模型系统性地应用于CTFST力学行为的全面预测,特别是实现了对完整力学曲线的精准拟合,这超越了传统ML模型仅预测单一强度指标的限制。 2. 解决小样本挑战:通过结合合成数据生成技术(VAE和GAN),有效缓解了土木工程中常见的高质量数据稀缺问题,提升了ML模型在有限数据下的学习能力和鲁棒性。 3. 模型泛化能力验证:不仅用数值数据验证,还通过独立的实验数据,证明了所提模型能够从圆形截面数据泛化到预测其他形状截面试件的力学行为,显示了其潜在的实际应用价值。
应用价值: 1. 高效设计工具:研究所开发的图形用户界面(GUI)工具,将复杂的ML模型封装成易用的软件,使结构工程师能够在设计初期快速、低成本地对不同配置的CTFST构件进行性能预估和参数分析。 2. 降低研发成本:该工具可以显著减少为寻找最优截面配置而进行的大量物理实验和精细有限元分析,加速设计迭代和优化过程。 3. 促进CTFST应用:通过提供可靠、便捷的预测手段,本研究有助于克服CTFST设计中的知识缺口和计算瓶颈,推动这种环保、高性能复合构件在可持续建筑工程中的更广泛应用。
六、 研究亮点
七、 其他有价值内容
研究在讨论部分指出,当前模型的性能在一定程度上受限于训练数据集的大小和多样性(主要基于圆形截面FE数据)。作者展望,未来通过积累更多包含不同几何参数、材料属性和截面形状(来自实验和数值模拟)的数据,并持续更新和重新训练模型,可以进一步扩展GUI工具的应用范围并提升其预测精度。这为后续研究指明了方向,即构建更大规模、更多样化的CTFST性能数据库是推动该领域ML应用深化的关键。