本研究由Jiaqi Wu、Fangyou Yan(通讯作者)、Qingzhu Jia和Qiang Wang共同完成,作者单位均为Tianjin University of Science and Technology(天津科技大学)化学工程与材料科学学院及海洋与环境学院。研究成果发表于期刊《Colloids and Surfaces A: Physicochemical and Engineering Aspects》第611卷(2021年),文章于2020年10月26日在线发表,标题为《QSPR for predicting the hydrophile-lipophile balance (HLB) of non-ionic surfactants》。
本研究属于胶体与界面科学领域,聚焦非离子表面活性剂的亲水亲油平衡值(Hydrophile-Lipophile Balance, HLB)预测。HLB值是表征表面活性剂性能的关键指标,由Griffin于1949年提出,定义为表面活性剂亲水性与疏水性的比值(0-20范围),直接影响其在乳化、分散、增溶等应用中的表现。传统实验测定HLB值的方法(如相转变温度法)耗时且复杂,而现有理论模型(如Davies基团贡献法)存在参数获取困难或适用范围有限的问题。因此,作者旨在开发一种基于定量结构-性质关系(QSPR)的通用预测模型,利用新型描述符(Norm descriptors)提升预测精度和适用范围。
数据集构建
从文献中收集237种非离子表面活性剂的HLB实验值,涵盖直链烷基、聚氧乙烯链和聚氧丙烯链三类结构(见补充材料Table S1)。数据集按4:1比例随机划分为训练集(190个样本)和测试集(47个样本)。
分子描述符开发
模型建立与验证
对比分析
与文献模型(如Gad等和Chen等)在相同和不同数据集上对比,评估预测性能(表4)。
模型性能
描述符贡献
t检验显示原子量(Paw)和最外层电子数(Poe)对HLB影响显著(表S2)。例如,描述符5(基于Poe和距离矩阵)系数为3.2133,反映亲水基团的电子分布对HLB的正向贡献。
应用域分析
94.1%样本位于标准化残差(-3,3)和临界杠杆值(h*=0.3632)内(图6),表明模型适用于广泛结构类型的非离子表面活性剂。
对比优势
本研究成功开发了基于Norm描述符的QSPR模型,首次实现非离子表面活性剂HLB值的高通量精准预测。科学价值体现在:
1. 方法论创新:Norm描述符通过原子级矩阵运算捕捉分子结构特征,为胶体科学中的QSPR建模提供新思路。
2. 应用扩展:模型覆盖三类主流非离子表面活性剂结构,解决了传统方法(如ECL法)参数缺失的局限。
3. 工业意义:可加速表面活性剂配方设计,减少实验成本,在化工、医药等领域具有实用潜力。
作者指出,Norm描述符概念可扩展至其他表面活性剂性质(如临界胶束浓度)的预测,为后续研究提供工具基础。此外,模型代码与计算流程的详细说明(补充材料)有助于方法复现。