本文由Yunfei Guo、Fei Yin、Wei Feng、Xudong Yan、Tao Xue、Shuqi Mei和Cheng-Lin Liu共同完成,分别来自中国科学院自动化研究所模式识别国家重点实验室、中国科学院大学人工智能学院、腾讯地图T实验室以及中国科学院脑科学与智能技术卓越中心。该研究发表于2023年的第37届AAAI人工智能会议(AAAI-23)。
社交网络本质上是一种图结构,其中个体作为节点,节点之间的边表示社交关系。社交关系预测依赖于图中的上下文信息来建模关系之间的高阶约束,然而,现有研究未能充分利用这些高阶约束。本文提出了一种基于三角约束的社交关系推理方法,并引入了三角推理图注意力网络(Triangular Reasoning Graph Attention Network, TRGAT)。TRGAT利用注意力机制在图中聚合具有三角约束的特征,从而通过高阶上下文进行迭代推理。此外,为了更好地表示个体的特征,本文还引入了节点对比学习(Node Contrastive Learning)来增强关系推理能力。
本文的研究方法主要包括以下几个步骤:
图构建:首先,使用卷积神经网络(CNN)和特征金字塔网络(FPN)提取图像的整体特征,然后通过RoIAlign提取个体的视觉特征和空间特征。这些特征被融合到输入图中,用于后续的关系推理。
节点特征提取:对于每个个体,使用RoIAlign从图像特征中提取视觉特征,并通过空间注意力机制聚焦于显著区域。最终,节点的特征由视觉特征和空间特征融合而成。
边特征提取:对于两个个体之间的关系,使用RoIAlign提取联合框内的视觉特征,并生成相应的空间特征。边的特征由视觉特征和空间特征融合而成。
三角推理图注意力网络(TRGAT):TRGAT的核心思想是通过三角约束进行高阶关系推理。具体来说,TRGAT首先寻找包含某条边的所有三角关系,然后通过评估每个三角关系对该边的重要性生成注意力系数,最后对这些三角关系中的特征进行加权聚合,得到最终的边特征用于分类。
节点对比学习:为了增强模型的推理能力,本文引入了节点对比学习。通过对比学习,模型能够更好地学习个体的特征表示,从而提高关系推理的准确性。
本文在两个流行的基准数据集PISC和PIPA上进行了广泛的实验。实验结果表明,TRGAT在社交关系推理任务中显著优于现有的方法,尤其是在PISC数据集上,TRGAT在粗粒度关系和细粒度关系上的平均精度(mAP)分别提高了4.5%和5.5%。此外,节点对比学习的引入进一步提升了模型的性能,尤其是在处理复杂社交关系时表现出色。
本文的主要贡献在于提出了基于三角约束的社交关系推理方法,并设计了TRGAT模型。TRGAT通过引入注意力机制和三角约束,能够有效地利用图中的高阶上下文信息,从而提高了社交关系推理的准确性和一致性。此外,节点对比学习的引入进一步增强了模型的特征表示能力。实验结果表明,TRGAT在多个基准数据集上均取得了显著的性能提升,证明了其在社交关系推理任务中的优越性。
本文提出的方法在社交事件理解、智能机器人、智能个人助理等领域具有广泛的应用前景。通过更准确地推理社交关系,这些应用可以更好地理解人类行为和社会互动,从而提供更加智能化的服务。
本文通过引入三角约束和节点对比学习,提出了一种新颖的社交关系推理方法TRGAT。实验结果表明,TRGAT在多个基准数据集上均取得了显著的性能提升,证明了其在社交关系推理任务中的优越性。该研究为社交关系推理领域提供了新的思路和方法,具有重要的理论和应用价值。