基于MRMR-SSGMM混合模型的煤浮选过程药剂用量识别与泡沫图像分类新方法

分享自：
基于MRMR-SSGMM混合模型的煤浮选过程药剂用量识别与泡沫图像分类新方法

矿业与冶金
计算机科学
期刊:applied intelligenceDOI:10.1007/s10489-021-02328-z
【点击此处】阅读全文、收藏及针对性提问
关于煤炭浮选药剂用量状态识别新方法：基于MRMR-SSGMM混合模型的泡沫图像分类研究学术报告
本文旨在向国内相关领域的研究人员介绍一篇发表于学术期刊《Applied Intelligence》2022年第52卷的原创性研究论文。该研究由Wenyan Cao、Ranfeng Wang、Mingqiang Fan、Xiang Fu、Haoran Wang和Yulong Wang共同完成，并于2021年5月10日在线发表。论文题为“A New Froth Image Classification Method Based on the MRMR-SSGMM Hybrid Model for Recognition of Reagent Dosage Condition in the Coal Flotation Process”，提出了一种创新的混合模型，用于煤炭浮选过程中基于泡沫图像的药剂用量状态智能识别。
一、 研究背景与目标
本研究隶属于矿物加工工程、过程控制与机器视觉交叉领域，具体聚焦于煤炭浮选过程的智能化。煤炭浮选是煤炭清洁高效利用的核心环节，其通过药剂改变煤颗粒表面疏水性，使精煤附着于气泡上浮，实现与杂质分离。在此过程中，药剂（捕收剂和起泡剂）的用量是影响浮选工况稳定性和精煤产品质量的关键因素。目前，国内大多数选煤厂仍依赖有经验的工人通过肉眼观察浮选泡沫的形态、颜色、纹理等特征来调节药剂添加，这种方式存在识别精度低、主观性强、滞后性大等问题，常导致药剂浪费、产品质量不稳定、生产成本增加。
随着机器视觉和机器学习技术的发展，利用图像设备替代人眼，通过图像处理和智能算法实时识别泡沫状态，进而精准控制药剂添加，成为解决上述技术瓶颈的最佳方案。然而，现有研究多集中于提取泡沫图像的单一或少数几种特征（如仅纹理或颜色），缺乏对多维度特征的系统筛选与融合，且采用的分类模型（如SVM、K-means、传统GMM等）存在对标记样本依赖高、参数敏感、聚类结果不直观或处理高维非线性数据能力有限等不足。特别是，鲜有研究将半监督学习引入浮选泡沫图像分类。
因此，本研究旨在解决两个核心问题：1）如何从泡沫图像提取的多维度特征中，自动筛选出对分类贡献最大的最优特征子集；2）如何构建一个高效、准确的分类模型，能够利用少量标记样本指导大量未标记样本的学习，实现浮选药剂用量状态的精准识别。最终目标是开发一套能够为药剂添加提供可靠指导的智能识别系统，实现药剂用量的精准及时控制，降低消耗，稳定产品质量。
二、 研究详细工作流程
本研究工作流程系统而完整，主要包含以下几个关键步骤：
1. 泡沫图像采集与特征提取： * 研究对象与样本量： 研究在工业现场进行，采集了煤炭浮选过程中产生的泡沫图像。首先，在五种已知的捕收剂与起泡剂配比条件下（1:3， 2:3， 0.5:3， 1:4， 1:2），每组进行10次实验，每次采集1张泡沫图像，共获得50张已知药剂条件的泡沫图像样本，并同步测量了对应的精煤灰分作为类别标签。此外，还额外采集了800张未知药剂条件下的泡沫图像样本，用于后续模型的训练与测试。最终用于模型训练和测试的图像总数达到1120张。 * 图像预处理与特征计算： 对采集的原始泡沫图像进行了一系列预处理，包括图像增强、去噪、二值化和形态学处理。随后，从每张处理后的图像中提取了三大类共10个特征： * 形态特征（3个）： 基于分水岭算法分割气泡后，计算气泡数量（N）、平均面积（A）、平均周长（C）。 * 颜色特征（3个）： 采用RGB色彩空间，计算图像R、G、B三个通道的平均值。 * 纹理特征（4个）： 基于灰度共生矩阵（GLCM），计算了能量（E）、熵（En）、惯性矩（I）和相关度（Re）四个纹理特征参数。 * 数据处理： 将所有样本的10个特征值构成一个综合特征数据集 X，并将已知样本的精煤灰分（对应五种泡沫类型A-E）作为类别信息 C。
2. 基于最大相关-最小冗余（MRMR）的特征选择： * 目的： 从10个初始特征中筛选出与类别相关性最大、彼此之间冗余性最小的最优特征子集，以降低维度、去除噪声、提升后续分类器性能。 * 方法与流程： 采用MRMR算法，该算法以互信息（Mutual Information）作为衡量指标。 * 最大相关（Max-Relevance）： 计算每个单独特征与类别标签 C 之间的互信息，筛选出与类别最相关的特征。 * 最小冗余（Min-Redundancy）： 在已选特征子集中，确保新加入的特征与已有特征之间的互信息（即冗余度）最小。 * 增量搜索： 采用增量搜索策略，逐步从剩余特征池中选择能使 φ = R1 - R2（相关性-冗余性）最大化的特征，直至达到预设的特征数量 m。 * 结果输出： 算法对10个特征进行了排序，最终确定了最优特征数量及具体特征。
3. 改进的高斯混合模型分类器（SSGMM）构建： * 动机： 传统的高斯混合模型（Gaussian Mixture Model， GMM）是一种无监督聚类算法，其训练目标不明确，聚类结果不可见，需要人工根据特征空间中的样本分布来判断类别，准确率较低。 * 创新方法： 本研究提出了半监督高斯混合模型（Semi-Supervised GMM， SSGMM）。其核心思想是引入少量已标记的泡沫图像特征样本（即上述50个已知类别的样本），与大量未标记样本（800个未知类别样本）混合。 * 工作流程： * 混合样本输入： 将标记样本和未标记样本的特征数据合并。 * GMM聚类： 对混合后的特征数据集使用GMM进行聚类。GMM假设数据由多个高斯分布混合而成，通过期望最大化（Expectation-Maximization， EM）算法迭代估计每个高斯分量的参数（均值、协方差、权重）。 * “聚类-映射”分类： 聚类完成后，每个簇中包含了一些已标记样本。通过将簇内已标记样本的类别信息映射到同簇的所有未标记样本上，从而实现对整个数据集的分类。这种方法利用少量标记样本的“指导”作用，解决了传统GMM聚类结果无标签的问题。
4. MRMR-SSGMM混合模型的集成与优化： * 模型耦合： 将MRMR特征选择算法与SSGMM分类器结合，形成MRMR-SSGMM混合模型。MRMR负责为SSGMM筛选最优输入特征，而SSGMM的分类准确率则作为评价MRMR筛选结果好坏的准则。 * 迭代优化流程： 1. 设定一个初始的待选特征数量 m。 2. MRMR算法根据该数量筛选出排名前 m 的特征子集。 3. 将该特征子集输入SSGMM分类器进行训练和测试。 4. 计算SSGMM的分类准确率。 5. 自动调整 m 的值，重复步骤2-4。 6. 通过不断迭代，寻找能使SSGMM分类器达到最高准确率的最佳特征数量和具体的特征组合。这是一个闭环优化过程。
5. 实验设计与性能评估： * 对比实验： 为了验证所提方法的优越性，研究将其与多种经典及先进的分类方法进行了对比，包括支持向量机（SVM）、人工神经网络（ANN）、朴素贝叶斯（NB）和潜在狄利克雷分布（LDA）。 * 评估指标： 采用总体分类准确率、各类别准确率、混淆矩阵、精确率（Precision）、召回率（Recall）和F1分数（F1-Score）以及计算时间等多个指标进行全面评估。 * 应用验证： 将训练好的最优MRMR-SSGMM模型应用于国内某选煤厂的工业现场，构建药剂用量状态识别系统，进行了连续24小时的跟踪测试，记录识别结果并与实际人工化验的精煤灰分进行对比，验证其实际应用效果和经济价值。
三、 主要研究结果
最优特征筛选结果： MRMR算法对10个初始特征的评估排序为：周长（C）> 熵（En）> 气泡数量（N）> R通道值（R）> 惯性矩（I）> G通道值（G）> B通道值（B）> 面积（A）> 能量（E）> 相关度（Re）。形态特征（C， N）和纹理特征（En）表现出与精煤灰分（类别）最强的相关性，而颜色特征（R， G， B）相关性相对较弱，这可能与煤炭本身的黑色特性有关。通过SSGMM分类器准确率反馈的迭代优化，最终确定最佳特征数量为4个，即周长（C）、熵（En）、气泡数量（N）和R通道值（R）。当使用这4个特征时，分类器准确率达到峰值（97.77%），增加或减少特征数量都会导致准确率下降，证明了特征筛选的有效性和必要性。
SSGMM分类可视化结果： 使用筛选出的4个最优特征，SSGMM成功对包含已知和未知类别的混合样本进行了分类。通过三维空间散点图（由于是4维特征，任选3维展示）可以清晰看到，五类泡沫（A-E）的特征样本在特征空间中形成了五个界限相对清晰的簇。少量已标记的样本（用特定符号表示）被成功用于“染色”其所在的整个簇，从而完成了对大部分未标记样本的类别分配，直观展示了SSGMM半监督学习的有效性。
模型性能对比结果： 实验结果表明，MRMR-SSGMM混合模型在多项指标上均优于其他对比方法。
总体准确率： MRMR-SSGMM达到97.77%，显著高于SVM（92.86%）、ANN（88.84%）、NB（90.18%）和LDA（84.82%）。
各类别准确率： 对于五种泡沫类型（A-E），MRMR-SSGMM的识别准确率均很高（94.12%-100%），且表现均衡，而其他方法在某些类别（如C类和E类）上准确率下降明显。
其他指标： 在精确率、召回率和F1分数的平均值上，MRMR-SSGMM（分别为0.976， 0.975， 0.975）也全面领先于其他模型。
计算效率： MRMR-SSGMM的平均计算时间为0.3秒，仅次于LDA（0.28秒），远快于SVM（0.4秒）和ANN（0.37秒），满足了工业实时性要求。
特征选择有效性验证： 为了证明MRMR特征选择的贡献，研究对比了使用筛选后的4个最优特征与随机选择2个未筛选特征（如E和Re）进行分类的效果。结果显示，使用未筛选特征时，不同类别的样本在特征空间中重叠严重，分类准确率仅为87.6%；而使用MRMR筛选后的特征，准确率提升至98.4%，显著改善了分类性能。
工业应用效果： 将系统应用于选煤厂实际生产，连续跟踪记录了三个班次的浮选过程。系统成功识别出多次因捕收剂过量或不足、起泡剂过量导致的工况异常（对应B， C， D类泡沫），其预测的精煤灰分区间与实际化验结果高度吻合。应用该技术后，与上一年度同期相比，药剂消耗量（捕收剂和起泡剂）明显下降，生产事故率月均降低了12.7%，精煤产品灰分指标的波动范围显著收窄且更加稳定，证明了该方法的实用性和经济价值。
四、 研究结论与价值
本研究成功提出并验证了一种基于MRMR-SSGMM混合模型的煤炭浮选泡沫图像分类新方法。主要结论如下： 1. 方法有效性： 该方法能够有效地从泡沫图像的多维度特征中自动筛选出最具判别力的特征子集，并利用半监督学习策略，仅需少量标记样本即可实现高精度、高效率的泡沫状态分类，从而准确识别浮选药剂用量状态。 2. 技术优势： 融合了特征选择（MRMR）与改进分类器（SSGMM）的混合框架，通过迭代优化实现了特征与分类器的协同增效，克服了传统方法中特征冗余、模型依赖大量标记数据或聚类结果不明确的缺点。 3. 应用价值： 该技术为煤炭浮选过程的智能化提供了一套可行的解决方案。通过实时、客观、准确地识别泡沫状态，能够为操作人员或自动控制系统提供可靠的药剂调节指导，有助于实现药剂添加的精准控制，达到稳定产品质量、降低药剂消耗、减少生产事故、提升经济效益的目的，推动煤炭浮选向更高水平的智能化发展。
五、 研究亮点
多特征融合与智能筛选： 首次系统地将泡沫图像的形态、颜色、纹理三类特征相结合，并引入MRMR算法进行定量化筛选，找到了对煤炭浮选泡沫状态分类贡献最大的核心特征组合，避免了特征选择的盲目性。
半监督学习模型的创新应用： 针对工业现场标记样本获取成本高的问题，创造性地改进了传统的无监督GMM模型，提出了SSGMM。通过引入少量标记样本引导聚类过程，实现了“聚类-映射”式的半监督分类，在保证高精度的同时降低了对标记数据的依赖。
闭环混合模型的构建： 提出了MRMR与SSGMM的混合建模框架，二者形成闭环优化：MRMR为SSGMM提供优质输入，SSGMM的准确率反馈指导MRMR寻找最优特征数量。这种设计使模型性能达到全局最优。
完整的工业验证： 研究不仅进行了详尽的离线实验对比分析，还将最终模型部署到实际选煤厂进行在线验证，用真实的生产数据和经济指标（药剂消耗、事故率、产品质量稳定性）证明了该方法的实用性和有效性，完成了从理论方法到工业应用的完整闭环。
六、 其他有价值内容
论文还对煤炭浮选泡沫在不同药剂条件下的表现进行了详细分析（对应图2），清晰阐述了泡沫形态（气泡大小、均匀度）、颜色（灰、黑）、纹理（复杂程度）与捕收剂、起泡剂用量及最终精煤灰分之间的对应关系，为基于图像的工况识别提供了坚实的工艺机理基础。此外，论文对相关领域工作（如GLCM、NGDLM纹理分析，SVM、K-means、CNN等分类方法在浮选中的应用）进行了综述，并指出了其局限性，从而凸显了本研究的创新点和必要性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问