不确定性引导的边界学习在失衡社交事件检测中的应用

分享自：
不确定性引导的边界学习在失衡社交事件检测中的应用

期刊:IEEE Transactions on Knowledge and Data EngineeringDOI:10.1109/TKDE.2023.3324510
本文介绍了一篇发表在《IEEE Transactions on Knowledge and Data Engineering》2024年6月刊上的研究论文，题为《Uncertainty-Guided Boundary Learning for Imbalanced Social Event Detection》。该研究由Jiaqian Ren、Hao Peng、Lei Jiang、Zhiwei Liu、Jia Wu、Zhengtao Yu和Philip S. Yu共同完成，主要研究领域为社交事件检测（Social Event Detection, SED）中的类别不平衡问题。
研究背景与动机社交事件检测旨在从海量的社交媒体信息中正确分类并检测出事件的发生。然而，现实世界中的社交事件数据通常呈现出严重的类别不平衡分布，即少数类别（尾部类别）的样本数量远远少于多数类别（头部类别）。这种不平衡分布使得训练出的模型在面对尾部类别时泛化能力较差，导致检测效果不佳。现有的研究大多从频率角度解决这一问题，强调对尾部类别的表示或分类器学习。然而，作者通过观察发现，相比于类别的稀有性，从经过良好训练的证据深度学习网络（Evidential Deep Learning, EDL）中估计的校准不确定性更能反映模型的性能。因此，本文提出了一种新的不确定性引导的类别不平衡学习框架（Uncertainty-Guided Class Imbalance Learning Framework, UCLSED）及其变体UCL-ECSED，旨在通过增强模型对不确定类别的泛化能力来提升整体性能。
研究方法与流程本文提出的框架主要包括两个模块：表示调整模块和多视角分类器模块。
表示调整模块：为了确保类别的可分性，作者设计了一种新的不确定性引导的对比学习损失函数（Uncertainty-Guided Contrastive Learning Loss, UCL及其变体UCL-EC）。该损失函数通过为不确定性较高的类别分配更大的类间间隔，来调整潜在空间中的表示分布。具体来说，UCL损失函数在训练过程中迫使所有类别（尤其是不确定类别）在特征空间中自适应地调整清晰的边界，从而减少类别之间的混淆。
多视角分类器模块：为了获得更鲁棒和准确的类别不确定性，作者结合了多视角证据分类器的结果，并通过Dempster-Shafer理论（Dempster-Shafer Theory, DST）进行融合。此外，还引入了一种额外的校准方法来确保不确定性的准确性。具体来说，作者使用EDL网络来估计每个视角的类别不确定性，并通过DST将这些不确定性结果进行融合，最终得到更鲁棒的分类结果。
实验结果作者在三个严重不平衡的社交事件数据集（Events2012_100、Events2018_100和CrisisLexT_7）上进行了广泛的实验。实验结果表明，本文提出的模型在所有类别（尤其是不确定类别）的社交事件表示和分类任务中均取得了显著的性能提升。具体来说，UCL-ECSED在Events2018_100数据集上的表现甚至超过了现有的最佳模型ETGNN约19%。此外，通过对比现有的长尾识别方法，本文提出的UCL-ECSED在所有数据集上均表现优异，进一步验证了其在不平衡数据上的优越性。
结论与意义本文提出的UCLSED框架通过引入不确定性引导的对比学习损失函数和多视角分类器模块，显著提升了模型在不平衡社交事件检测任务中的表现。该框架的核心思想是通过不确定性来指导表示学习，从而增强模型对不确定类别的泛化能力。实验结果表明，UCLSED不仅在整体性能上优于现有方法，尤其在不确定类别上的表现尤为突出。
研究亮点不确定性引导的表示学习：本文首次将不确定性引入到不平衡数据的表示学习中，通过为不确定性较高的类别分配更大的类间间隔，显著提升了模型的泛化能力。
多视角不确定性融合：通过结合多视角证据分类器的结果，并使用Dempster-Shafer理论进行融合，本文提出的方法能够更鲁棒地估计类别不确定性。
广泛的实验验证：在三个不平衡社交事件数据集上的实验结果表明，本文提出的方法在所有类别（尤其是不确定类别）上均取得了显著的性能提升。
未来工作尽管本文提出的方法在不平衡社交事件检测任务中取得了显著的效果，但仍有一些局限性。例如，UCLSED和UCL-ECSED仅为每个类别学习一个单一的原型，这不足以处理遵循多模态分布的复杂类别。未来的工作可以探索如何扩展为多个原型，以进一步提升模型的表达能力。
本文为不平衡社交事件检测任务提供了一种新的解决方案，具有重要的理论和应用价值。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问