分享自:

基于深度学习的Web of Things和社交媒体中的网络欺凌自动识别

期刊:ieee transactions on big dataDOI:10.1109/tbdata.2024.3409939

该文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:

主要作者及研究机构

本研究的主要作者包括Fahd N. Al-Wesabi、Marwa Obayya、Jamal AlSamri、Rana Alabdan、Nojood O Aljehane、Sana Alazwari、Fahad F. Alruwaili、Manar Ahmed Hamza和A Swathi。他们分别来自沙特阿拉伯的多个大学和研究机构,包括King Khalid University、Princess Nourah bint Abdulrahman University、Majmaah University、University of Tabuk、Taif University、Shaqra University和Prince Sattam bin Abdulaziz University,以及捷克共和国的University of Hradec Kralove。该研究发表于2025年1月/2月的《IEEE Transactions on Big Data》期刊第11卷第1期。

学术背景

本研究的主要科学领域是深度学习(Deep Learning, DL)和网络欺凌(Cyberbullying)检测。随着物联网(Web of Things, WoT)和社交媒体的快速发展,网络欺凌问题日益严重,尤其是对青少年的心理健康和社会互动造成了严重影响。尽管已有研究使用传统的机器学习方法检测网络欺凌,但这些方法在处理大规模、多样化的网络内容时存在局限性。因此,本研究旨在开发一种基于深度学习的框架,通过结合卷积神经网络(Convolutional Neural Network, CNN)和二元郊狼优化算法(Binary Coyote Optimization, BCO),自动识别和分类网络欺凌行为,以提高检测的准确性和效率。

研究流程

本研究包括以下几个主要步骤:数据收集、数据预处理、特征选择、模型训练和评估。

  1. 数据收集:研究使用了三个公开的数据集,分别是Formspring、Twitter和Wikipedia。这些数据集包含了大量用户生成的内容,并经过人工标注,标记了网络欺凌和非网络欺凌的实例。Formspring数据集包含12000个问答对,其中825个被标记为网络欺凌;Twitter数据集包含16000条推文,其中3117条涉及性别歧视,1937条涉及种族歧视;Wikipedia数据集包含10000条用户评论,其中13590条被标记为“人身攻击”。

  2. 数据预处理:为了准备数据用于深度学习模型,研究对文本数据进行了详细的预处理,包括分词(Tokenization)、词干提取(Stemming)、去除停用词(Stop-word Removal)等。此外,还处理了特殊字符、表情符号和URL,以确保数据的完整性。

  3. 特征选择:研究采用了基于二元郊狼优化(BCO)的特征子集选择方法,以增强分类效率。BCO算法能够高效地选择出与网络欺凌检测最相关的特征,从而减少计算复杂度并提高分类准确性。

  4. 模型训练:研究使用了卷积神经网络(CNN)作为主要模型,并结合了BCO算法进行优化。CNN模型能够自动从文本数据中提取特征,并适应网络欺凌行为的动态变化。模型训练过程中,数据集被分为训练集和验证集,通过梯度下降法优化模型参数,以防止过拟合并确保模型的泛化能力。

  5. 模型评估:研究使用了多个评估指标来衡量模型的性能,包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数(F1-score)。这些指标帮助研究者全面了解模型在检测和分类网络欺凌内容方面的表现。

主要结果

本研究的模型在三个数据集上均表现出色,准确率分别为Formspring 99.5%、Twitter 99.7%和Wikipedia 99.3%。这些结果表明,所提出的基于CNN和BCO的模型能够高效地检测出网络欺凌内容。此外,特征选择方法显著提高了分类效率,减少了模型的计算复杂度。

  1. Formspring数据集:模型在该数据集上的准确率为99.5%,表明其能够有效识别问答对中的网络欺凌内容。
  2. Twitter数据集:模型在该数据集上的准确率为99.7%,表明其在处理推文数据时表现出色,尤其是在检测性别歧视和种族歧视方面。
  3. Wikipedia数据集:模型在该数据集上的准确率为99.3%,表明其在处理用户评论时具有较高的分类能力。

结论

本研究提出了一种基于深度学习的网络欺凌检测框架,通过结合CNN和BCO算法,显著提高了检测的准确性和效率。研究结果表明,该模型在处理不同平台的网络内容时表现出色,能够有效识别和分类网络欺凌行为。此外,特征选择方法的引入进一步优化了模型的性能,减少了计算复杂度。该研究为网络欺凌的自动检测提供了新的解决方案,具有重要的科学价值和应用前景。

研究亮点

  1. 创新性方法:本研究首次将深度学习中的卷积神经网络(CNN)与二元郊狼优化算法(BCO)结合,提出了一种新的网络欺凌检测方法。
  2. 高准确率:模型在三个数据集上的准确率均超过99%,表明其在检测网络欺凌内容方面具有极高的可靠性。
  3. 跨平台适用性:研究使用了来自不同平台的数据集,验证了模型在处理多样化网络内容时的泛化能力。
  4. 特征选择优化:通过BCO算法进行特征选择,显著提高了模型的分类效率,减少了计算复杂度。

其他有价值的内容

本研究还探讨了模型在实际应用中的潜在挑战,例如处理多媒体内容(如图片和视频)时的局限性,以及在保护用户隐私和确保算法公平性方面的伦理问题。未来的研究可以进一步扩展模型的功能,以应对这些挑战,并提供更全面的网络欺凌检测解决方案。

本研究为网络欺凌的自动检测提供了新的思路和方法,具有重要的学术价值和实际应用意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com