基于字符级卷积神经网络与捷径的社交媒体文本网络欺凌检测

分享自：
基于字符级卷积神经网络与捷径的社交媒体文本网络欺凌检测

期刊:Concurrency and Computation: Practice and ExperienceDOI:10.1002/cpe.5627
该文档属于类型a，即报告了一项原创研究。以下是基于文档内容的学术报告：
作者及研究机构
 本研究的作者包括Nijia Lu、Guohua Wu、Zhen Zhang、Yitao Zheng、Yizhi Ren和Kim-Kwang Raymond Choo。研究团队分别来自中国杭州电子科技大学网络空间安全学院以及美国德克萨斯大学圣安东尼奥分校的信息系统与网络安全系和电气与计算机工程系。研究论文于2020年发表在期刊《Concurrency and Computation: Practice and Experience》上。
学术背景
 随着人们在社交媒体上花费的时间日益增加，网络欺凌（cyberbullying）已成为一个亟待解决的社会问题。网络欺凌通常通过发送包含侮辱性或攻击性内容的信息来实现，对受害者造成严重的心理伤害，甚至可能导致自残或自杀等极端后果。然而，由于社交媒体内容的短小、嘈杂、非结构化以及拼写错误和符号的干扰，传统的基于词汇知识的机器学习方法在检测网络欺凌时表现不佳。因此，本研究旨在提出一种基于字符级卷积神经网络（character-level convolutional neural network, CNN）的模型，以识别社交媒体文本中的网络欺凌内容。
研究流程
 1. 模型设计
 本研究提出了一种名为Char-CNNs的模型，其核心是基于字符级卷积神经网络，并引入了“捷径”（shortcuts）结构。该模型将字符作为最小的学习单元，能够克服拼写错误和故意混淆的词汇问题。通过使用不同尺寸的卷积滤波器，模型能够捕捉不同层次的字符特征。捷径结构用于将不同层次的特征拼接起来，以学习更细粒度的欺凌信号。此外，模型采用了焦点损失函数（focal loss）来解决数据集中类别不平衡的问题。
数据集构建
 研究团队提供了一个新的中文微博评论数据集，专门用于网络欺凌检测。该数据集包含19,395条评论，其中5,067条被标记为欺凌内容。数据集的构建方法包括：选择具有负面声誉或经历过恶性事件的20多位名人微博下的评论，以及补充涉及品牌、游戏和社会新闻的评论。所有数据均由熟悉微博的三名成员手动标注，标注标准包括使用性别歧视、种族歧视或地域歧视词汇、使用侮辱性语言、歪曲事实、呼吁暴力等。
实验设置
 实验在中文微博数据集和英文推特数据集上进行。模型使用了不同尺寸的卷积滤波器（第一层为3、4、5，第二层为7、8），每层包含256个特征图。局部最大池化（local max-pooling）的块大小为3，dropout率为0.5，L2正则化参数为3。焦点损失函数的参数设置为α=0.5，γ=2。模型使用Adam优化器进行训练。
对比实验
 研究将Char-CNNs模型与多种基线方法进行了对比，包括基于TF-IDF和支持向量机（SVM）的传统方法、基于字符n-gram和逻辑回归（LR）的方法以及基于词级CNN的方法。实验结果表明，Char-CNNs在精确率（precision）、F1值和召回率（recall）上均优于其他方法。
主要结果
 1. 模型性能
 在中文微博数据集上，Char-CNNs的精确率、F1值和召回率分别为79.0%、71.6%和69.8%；在英文推特数据集上，分别为81.0%、74.2%和70.5%。这些结果表明，Char-CNNs在处理不同语言的社交媒体文本时均具有较高的检测能力。
焦点损失函数的效果
 研究通过调整焦点损失函数的参数，验证了其在处理类别不平衡问题时的有效性。实验发现，当正负样本比例为1:20时，Char-CNNs的召回率比其他方法高出5至13个百分点。
字符级特征的优势
 实验结果表明，字符级特征在检测网络欺凌任务中表现优于词级特征。Char-CNNs在字符级输入下的精确率比词级输入高出8.6个百分点，F1值高出4.0个百分点。
捷径结构的作用
 通过对比实验，研究发现使用捷径结构能够将模型的精确率、F1值和召回率分别提高3.7、5.0和6.8个百分点。这表明，通过拼接不同层次的特征，模型能够更好地捕捉欺凌信号。
结论
 本研究提出了一种基于字符级卷积神经网络的模型，能够有效检测社交媒体文本中的网络欺凌内容。该模型通过字符级特征学习、捷径结构和焦点损失函数，克服了传统方法在处理短小、嘈杂和非结构化文本时的局限性。实验结果表明，Char-CNNs在中文微博和英文推特数据集上均表现出色，为解决网络欺凌问题提供了一种自动化解决方案。
研究亮点
 1. 创新性模型设计
 Char-CNNs模型首次将字符级卷积神经网络和捷径结构结合，用于网络欺凌检测，显著提高了模型的性能。
新数据集的构建
 研究团队提供了一个专门用于网络欺凌检测的中文微博评论数据集，填补了该领域的数据空白。
焦点损失函数的应用
 通过引入焦点损失函数，研究成功解决了类别不平衡问题，为类似任务提供了新的思路。
跨语言验证
 实验在中文和英文数据集上均进行了验证，证明了模型的跨语言适用性。
其他价值
 本研究不仅为网络欺凌检测提供了技术解决方案，还为社交媒体平台的内容监管提供了参考。未来，研究团队计划进一步扩展模型的层数，并探索检测更多类型的欺凌行为。
以上报告详细介绍了研究的背景、方法、结果和意义，旨在为其他研究人员提供全面的参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问