Représentation du mouvement structurel régional 3D du visage à l'aide de réseaux de nuages de points légers pour la reconnaissance des micro-expressions

Représentation du mouvement structurel régional 3D basée sur des réseaux de point cloud légers pour la reconnaissance des micro-expressions Contexte académique Les micro-expressions (Micro-expressions, MEs) sont une forme brève et subtile d’expression faciale humaine, généralement durant entre 1⁄25 et 1⁄5 de seconde. En raison de leur caractère spo...

Apprentissage contrastif hyperbolique multi-échelle pour la reconnaissance des émotions EEG inter-sujets

Reconnaissance des émotions EEG inter-sujets basée sur l’apprentissage contrastif hyperbolique multi-échelle Contexte académique L’électroencéphalographie (EEG), en tant que signal physiologique, joue un rôle important dans le domaine du calcul affectif (Affective Computing). Comparé aux indices non physiologiques traditionnels (comme les expressio...

Analyse des sentiments multimodaux avec apprentissage de représentation désenchevêtrée basé sur l'information mutuelle

Apprentissage de représentation découplée basé sur l’information mutuelle pour l’analyse des sentiments multimodaux : une étude innovante Contexte académique Avec le développement rapide des médias sociaux, la quantité de contenu multimédia généré par les utilisateurs (comme les tweets et les vidéos) a augmenté de manière significative. Ces données...

Reconnaissance robuste des émotions vocales à deux flux incorporant des modulations spectro-temporelles

Étude sur la reconnaissance robuste des émotions vocales à deux flux basée sur les caractéristiques de modulation spectro-temporelle Contexte académique La reconnaissance des émotions vocales (Speech Emotion Recognition, SER) est une technologie qui identifie les émotions en analysant le contenu émotionnel dans la parole humaine. Elle a un potentie...

Mécanismes neuronaux de l'apprentissage relationnel et de la réassemblage rapide des connaissances dans les réseaux neuronaux plastiques

Mécanismes neuronaux et apprentissage relationnel : réassemblage rapide des connaissances dans les réseaux neuronaux Contexte Les humains et les animaux possèdent une capacité remarquable à apprendre les relations entre les éléments de leur expérience (comme les stimuli, les objets et les événements), permettant ainsi une généralisation structurée ...

Apprentissage avec des biais inductifs enrichis pour les modèles vision-langage

Learning with Enriched Inductive Biases for Vision-Language Models Contexte de recherche et problématique Ces dernières années, les modèles visio-langagiers (Vision-Language Models, VLMs) ont enregistré des progrès significatifs dans les domaines de la vision par ordinateur et du traitement du langage naturel. Ces modèles sont pré-entraînés sur de ...