基于多分辨率信号小波网络的语音情感识别研究

多分辨率信号小波网络在语音情感识别中的应用:SigWavNet 学术背景 语音情感识别(Speech Emotion Recognition, SER)在人机交互和心理学评估中扮演着重要角色。它通过分析语音信号来识别说话者的情感状态,广泛应用于紧急呼叫中心、健康护理和虚拟AI助手等领域。然而,尽管该领域取得了显著进展,系统复杂性、特征区分度不足以及噪声干扰等问题仍然存在。为了解决这些挑战,来自University of Québec、Concordia University和University of Québec at Montréal的研究团队提出了一种新的端到端深度学习框架——SigWavNet,直接从语音波形信号中提取有意义的特征,并通过多分辨率分析提升情感识别的准确性。 论文来源 ...

基于强化学习的共情反应生成框架

人工智能对话系统中的共情反应生成研究 学术背景 随着人工智能技术的快速发展,开放域对话系统(open-domain dialogue systems)逐渐成为研究热点。这类系统旨在与用户进行自然、流畅的对话,提供合理的回应。然而,尽管现有的对话系统在语言流畅性和连贯性方面取得了显著进展,但其在共情(empathy)能力上的不足仍然显著。共情是指理解他人经历和情感的能力,包括情感共情(affective empathy)和认知共情(cognitive empathy)。情感共情涉及对用户情感的反应,而认知共情则侧重于理解用户的情境。共情是人类交流的基本特征,对于构建拟人化的对话系统至关重要。 然而,现有的共情反应生成(empathetic response generation)方法主要依赖于...

基于文本引导的重建网络在不确定性缺失模态下的情感分析

基于文本引导的重构网络在多模态情感分析中的应用 学术背景 多模态情感分析(Multimodal Sentiment Analysis, MSA)是一项旨在整合文本、视觉和声学信号中的情感表达的研究领域。随着用户生成在线内容的丰富,MSA在提高情感理解和人机交互方面展现出巨大潜力。然而,现有的MSA方法面临两个主要问题:1)在未对齐的多模态数据中,文本的主导作用未被充分利用;2)在不确定缺失模态的情况下,模态的探索不足。这些问题导致情感判断的准确性受到限制,尤其是在实际应用中,背景噪音、传感器故障、面部缺失/遮挡、光线条件不佳、转录缺失等因素可能导致模态的随机缺失。 为了解决这些问题,研究者提出了一种基于文本引导的重构网络(Text-Guided Reconstruction Network,...

基于Conformal Prediction的抑郁症预测方法

基于Conformal Prediction的抑郁症预测方法研究 背景介绍 抑郁症是一种常见的心理障碍,表现为持续的悲伤、衰弱以及对活动失去兴趣。它不仅增加了自杀的风险,还给患者及其家庭带来了巨大的心理负担。目前,抑郁症的诊断主要依赖于心理健康报告,如Beck抑郁量表(BDI-II)、Hamilton抑郁评定量表(HRSD)和患者健康问卷(PHQ-8)。然而,这些诊断方法依赖于临床医生的主观经验和患者的认知能力,耗时且效率低下。 近年来,随着深度学习技术的快速发展,基于深度学习的抑郁症预测方法显示出巨大的潜力。然而,这些深度模型通常作为“黑箱”模型部署,缺乏可信度,无法提供预测的置信度。对于抑郁症预测这样的高风险临床应用,不确定性量化在决策过程中至关重要。为此,本研究提出了基于Conform...

机器人监控行为对老年人护理中注意力分散及技术接受度的影响

机器人监控行为对老年人注意力分散及技术接受度的影响研究 学术背景 随着社会老龄化问题的加剧,老年护理的需求日益增长。特别是在新冠疫情期间,老年人因社交隔离而面临的心理和生理健康问题更加突出。社交机器人(Social Robots)作为一种新兴技术,被认为可以在老年护理中发挥重要作用,尤其是在监测老年人的健康和安全方面。然而,机器人的存在及其行为可能会干扰老年人的日常活动,导致不适甚至排斥。因此,研究机器人行为对老年人注意力分散的影响,以及老年人对机器人技术的接受度,具有重要意义。 本研究旨在探讨机器人在执行监控任务时,其行为对老年人参与日常活动的影响,特别是不同认知负荷任务下老年人对机器人行为的反应。通过主观和客观指标,研究人员试图评估老年人对机器人的参与度及其对自身任务的脱离程度,并进一步...

通过视觉道路场景分析驾驶员压力估计

基于视觉道路场景的驾驶员压力估计研究 学术背景 驾驶员压力是导致交通事故、伤害和死亡的重要因素。研究表明,94%的交通事故与驾驶员相关,其中注意力不集中、内外部分心、速度控制不当等都与驾驶员的压力密切相关。因此,识别和管理驾驶员的压力状态对于提升驾驶体验和安全性至关重要。然而,现有的驾驶员压力识别方法主要依赖于生理数据(如心率、皮肤电活动等)或车辆操作数据(如方向盘和踏板活动),这些方法通常需要佩戴设备或缺乏对驾驶环境的全面考虑。相比之下,基于视觉道路场景的分析为驾驶员压力估计提供了一种无侵入式且具有广泛适用性的解决方案。本研究旨在探讨视觉道路场景对驾驶员压力估计的贡献,并通过机器学习模型验证其有效性。 论文来源 本论文由Cristina Bustos、Albert Sole-Ribalta...