分享自:

人工神经网络预测水/有机溶剂混合物中离子表面活性剂的临界胶束浓度

期刊:Tenside Surfactants DetergentsDOI:10.1515/tsd-2024-2623

这篇文档属于类型a,是一篇关于利用人工神经网络预测离子表面活性剂临界胶束浓度的原创研究论文。以下是详细的学术报告:


作者及机构
本研究由西班牙维戈大学(Universidade de Vigo)物理化学系的Anton Soria-López、María García-Martí、Enrique Barreiro和Juan C. Mejuto*(通讯作者)合作完成,发表于期刊《Tenside Surfactants Detergents》2024年第61卷第6期(页码519–529),在线发布日期为2024年9月26日。


学术背景
研究领域:物理化学与计算化学交叉领域,聚焦表面活性剂的临界胶束浓度(Critical Micelle Concentration, CMC)预测。
研究动机:CMC是表面活性剂的关键物理化学性质,受温度、压力、pH、溶剂组成、表面活性剂化学结构及电解质等因素影响。传统实验测定CMC耗时昂贵,尤其在高温高压条件下。现有研究多基于固定条件(如室温、纯水)的定量结构-性质关系(QSAR)模型,忽略了多变量交互作用。
研究目标:开发一种人工神经网络(Artificial Neural Network, ANN)模型,整合溶剂组成(如温度、分子量、摩尔分数、log P)和表面活性剂化学结构(元素原子数)等多变量,预测离子表面活性剂在有机溶剂/水混合体系中的CMC值。


研究流程
1. 数据收集与处理
- 数据来源:从文献中收集10种离子表面活性剂(6种阳离子、4种阴离子)在有机溶剂/水混合体系中的258组CMC实验数据,溶剂包括丙酮、甲醇、乙醇、异丙醇和乙二醇。
- 变量设计:输入变量包括溶剂参数(摩尔分数、分子量、log P、温度)和表面活性剂化学结构参数(C、H、Br、Cl、N、Na、O、S的原子数);输出变量为CMC的对数值(log CMC)。
- 数据划分:随机分为训练集(70%)、验证集(20%)和测试集(10%)。

  1. 人工神经网络建模

    • 模型架构:采用多层感知机(MLP)结构,输入层12个神经元(对应12个输入变量),隐藏层25个神经元(基于2n+1规则,n为输入变量数),输出层1个神经元(log CMC)。
    • 算法与参数:使用反向传播算法(Backpropagation)和Sigmoid激活函数;超参数包括训练周期(1–524,288)、线性/对数尺度及衰减设置。
    • 归一化处理:对比了未归一化模型(ANN、ANNl)与归一化模型(ANNR、ANNR-l、ANNZ、ANNZ-l),后者采用范围变换(-1至1)或Z变换以消除量纲影响。
  2. 模型评估

    • 统计指标:均方根误差(RMSE)、平均绝对百分比误差(MAPE)和决定系数(R²)。
    • 性能验证:通过训练集优化权重,验证集选择最佳模型,测试集评估泛化能力。

主要结果
1. 模型性能
- 归一化模型显著优于未归一化模型(ANNR RMSE=0.046 vs. ANN RMSE=0.226)。
- 最佳模型ANNZ:验证集RMSE=0.040 M(R²=0.995,MAPE=2.7%),测试集RMSE=0.069 M(R²=0.970,MAPE=3.5%)。
- 预测误差分析:少数高偏差数据点(如log CMC=-1.82的预测值为-2.09,误差14.4%)可能源于实验数据离散性。

  1. 与传统方法的对比
    • 现有QSAR模型多针对单一类型表面活性剂(如阴离子)且忽略温度/溶剂影响(如Yuan等2002年研究R²>0.98,但仅限40°C纯水体系)。
    • 本研究首次整合多变量(温度、溶剂组成、化学结构),ANNZ模型性能与随机森林(RF)或支持向量机(SVM)相当(如Abooali等2023年SGB模型RMSE=0.019)。

结论与价值
1. 科学意义
- 证明了ANN在多变量CMC预测中的有效性,为复杂条件下表面活性剂行为研究提供了新工具。
- 揭示了溶剂极性和表面活性剂元素组成对CMC的协同影响机制,如log P与温度的非线性关系。

  1. 应用价值
    • 可替代实验方法快速预测CMC,降低医药、化妆品、洗涤剂等行业研发成本。
    • 模型框架可扩展至其他两亲性分子(如生物表面活性剂)的胶束化研究。

研究亮点
1. 方法创新:首次将ANN应用于多变量(溶剂+化学结构)CMC预测,模型拓扑结构(12-25-1)为同类研究提供参考。
2. 数据全面性:涵盖10种离子表面活性剂和5种有机溶剂,数据量(258组)远超同类研究(如Boukelkal等2024年研究仅用14个描述符)。
3. 可解释性:通过输入变量重要性分析(如碳原子数对CMC的负相关性),揭示了化学结构与胶束形成的定量关系。


其他价值
- 开源工具应用:使用RapidMiner Studio软件(教育版)实现模型开发,为后续研究提供可复现的算法流程。
- 研究局限性:未考虑压力、pH等变量,未来可结合图神经网络(GNN)进一步优化(如Qin等2021年工作)。


此研究为表面活性剂物理化学性质的机器学习预测树立了新范式,兼具理论深度与工业应用潜力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com