本文档属于类型a(单篇原创研究论文),以下是针对该研究的学术报告:
本研究由Liyan Liu、Luxuan Feng和Fan Min(通讯作者)共同完成,三位作者均来自中国西南石油大学(Southwest Petroleum University)的计算机科学与软件工程学院、机器学习实验室及人工智能研究所。研究成果发表于期刊《Knowledge-Based Systems》第315卷(2025年),文章编号113319,标题为《Boosting Semi-Supervised Regressor via Confidence-Weighted Consistency Regularization》。
研究领域:本研究属于机器学习中的半监督回归(Semi-Supervised Regression, SSR)领域,旨在利用少量标注数据和大量未标注数据提升回归模型的性能。
研究动机:传统半监督学习方法(如一致性正则化和伪标签技术)在分类任务中表现优异,但在回归任务中面临挑战。现有增强方法(如AdaBoost和GBDT)依赖弱学习器集成,对噪声敏感且难以并行化。本研究提出BS2C算法(Boosted Semi-Supervised Regressor with Confidence-weighted Consistency Regularization),通过动态调整伪标签权重和融合神经网络与现有SSR模型,解决上述问题。
目标:
1. 提升复杂半监督回归器的性能;
2. 通过置信度加权减少噪声影响;
3. 验证算法在多样化数据集上的普适性。
BS2C包含三个阶段:
- 阶段1(并行预测):构建一个与现有SSR模型并行的神经网络,通过高斯噪声增强数据生成初始伪标签。
- 阶段2(伪标签筛选):基于置信度(预测值差异范围)选择高可靠性伪标签,动态加权一致性损失。
- 阶段3(损失优化):结合监督损失(标注数据)和一致性损失(未标注数据),采用动态权重函数调整两者比例。
科学价值:
- 提出了一种新型半监督回归增强框架,通过置信度加权和动态损失整合提升模型鲁棒性。
- 验证了神经网络与传统SSR模型协同训练的可行性。
应用价值:
- 适用于标注成本高的场景(如医疗、工业监测),可减少对标注数据的依赖。
- 开源代码(GitHub仓库)便于社区复现与扩展。
(报告总字数:约1500字)