基于决策融合分类器的社交媒体多模态网络欺凌检测

分享自：
基于决策融合分类器的社交媒体多模态网络欺凌检测

期刊:multimedia tools and applicationsDOI:10.1007/s11042-023-16402-w
本文档属于类型a，即报告了一项原创研究。以下是针对该研究的学术报告：
主要作者与机构
 本研究由Neha Minder Singh和Sanjay Kumar Sharma共同完成，两位作者均来自印度印多尔东方大学计算机科学与工程学院。该研究发表于2024年的期刊《Multimedia Tools and Applications》上，具体卷号为83，页码为20507–20535。
学术背景
 随着社交媒体的普及，网络欺凌（cyberbullying）已成为一个严重的社会问题，尤其对青少年、儿童和成年人造成了情感和心理上的伤害。尽管已有许多研究致力于检测网络欺凌，但大多数研究仅基于文本内容，忽略了视觉和音频等多媒体形式。因此，本研究旨在开发一种自动化的多模态网络欺凌检测系统，通过融合文本、图像和音频数据，利用多模态决策融合分类器（Multi-Modal Decision Fusion Classifier, MMDFC）来提高检测的准确性。
研究流程
 本研究的主要流程包括数据收集、多模态生成、基于分数的融合和分类。具体步骤如下：
 1. 数据收集：从公开的社交媒体平台和在线资源中收集多模态数据，包括文本、图像和音频。文本数据来自Kaggle的推文数据集，图像数据来自在线资源，音频数据来自ADIMA（Abuse Detection in Multilingual Audio）数据集。
 2. 多模态生成：
 - 文本模态生成：首先对文本数据进行预处理，包括去除噪声（如URL、表情符号、标签和标点符号）、词干提取、转换为小写和去除停用词。然后使用TF-AIDF（Term Frequency-Average Inverse Document Frequency）技术提取特征，并通过混合双向长短期记忆网络辅助注意力分层胶囊网络（BiLSTM-AHCNet）生成文本模态。
 - 图像模态生成：使用调优的Aquila EfficientB0（Tuned AEB0）模型生成图像模态。该模型结合了元启发式优化方法，通过Aquila优化器调整超参数，以提高模型的训练效果。
 - 音频模态生成：使用Librosa库提取音频特征，如对数梅尔频谱（Log-Mel Spectrograms）、能量、振幅包络和零交叉率（Zero-Crossing Rate），并通过注意力卷积神经网络（ACNN）生成音频模态。
 3. 特征融合与分类：将生成的文本、图像和音频模态通过多模态决策融合分类器（MMDFC）进行融合，并使用Softmax层进行分类。在融合阶段，基于马群优化算法（Horse Herd Optimization）的加权方案被用于提高特征的准确性。
 4. 实验与分析：使用Python进行仿真分析，通过测量准确率（98.23%）、F1分数（98.22%）、特异性（98.47%）和AUC（0.982）等性能指标，验证了所提技术的有效性。
主要结果
 1. 文本模态生成：通过BiLSTM-AHCNet模型生成的文本模态在分类任务中表现出色，准确率达到98.23%。
 2. 图像模态生成：调优的Aquila EfficientB0模型在图像模态生成中表现优异，显著提高了分类的准确性。
 3. 音频模态生成：通过ACNN模型生成的音频模态在分类任务中也取得了较高的准确率。
 4. 多模态融合与分类：MMDFC框架在多模态融合中表现出色，准确率达到98.23%，显著优于现有的单模态或双模态检测方法。
 5. 对比分析：与现有的深度学习模型（如CNN、BiLSTM、DNN、RNN和Autoencoder）相比，所提出的方法在准确率、F1分数和AUC等指标上均表现更优。
结论
 本研究提出了一种基于深度学习的多模态网络欺凌检测框架，通过融合文本、图像和音频数据，显著提高了检测的准确性。该框架在处理多模态数据时表现出色，能够有效识别社交媒体中的欺凌行为。实验结果表明，所提出的方法在准确率、F1分数和AUC等性能指标上均优于现有的检测方法，具有较高的科学价值和应用价值。
研究亮点
 1. 多模态融合：本研究首次将文本、图像和音频三种模态融合，提出了一种全新的多模态网络欺凌检测框架。
 2. 创新模型：提出了BiLSTM-AHCNet、Tuned AEB0和ACNN等创新模型，分别用于生成文本、图像和音频模态。
 3. 优化算法：在特征融合阶段，引入了马群优化算法，进一步提高了分类的准确性。
 4. 高性能表现：所提出的方法在多个性能指标上均表现优异，尤其是在准确率和AUC方面，显著优于现有方法。
其他有价值的内容
 本研究还通过消融实验（Ablation Experiments）验证了各个模块的重要性，证明了每个模块对整体性能的贡献。此外，研究还在其他流行的数据集（如Wisconsin数据集和Bullying Traces数据集）上进行了性能分析，进一步验证了所提出方法的鲁棒性和通用性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问