Apprentissage et régularisation de la représentation découplée par contraste pour la manipulation des expressions faciales préservant la parole

Apprentissage par Représentation Découplée Contrastive pour la Manipulation des Expressions Faciales en Préservant la Voix Introduction Ces dernières années, avec le développement rapide de la réalité virtuelle, de la production cinématographique et des technologies d’interaction homme-machine, la manipulation des expressions faciales est devenue u...

DiffuVolume : Modèle de diffusion pour l'appariement stéréo basé sur le volume

 

DiffuVolume - Une nouvelle méthode de stéréo matching basée sur le modèle de diffusion Contexte de recherche et problématique Le stéréo matching (Stereo Matching) est une tâche essentielle dans le domaine de la vision par ordinateur, avec des applications largement répandues dans les domaines de la conduite autonome et de la navigation robotique. S...

Apprentissage de la représentation faciale cohésive et consciente de la posture par apprentissage contrastif

Améliorer la perception des poses dans l’apprentissage autodidacte de représentations faciales Contexte de recherche et problématique Dans le domaine de la vision par ordinateur, l’apprentissage des représentations faciales (Facial Representation Learning) est une tâche importante. En analysant les images faciales, nous pouvons extraire des informa...

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Un cadre de supervision mutuelle pour la segmentation et la génération d’expressions référentielles Contexte de recherche et problématique Ces dernières années, les technologies d’interaction vision-langage ont connu des progrès significatifs dans le domaine de l’intelligence artificielle. Parmi elles, la segmentation d’expressions référentielles (...

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

GL-MCM : Correspondance maximale globale et locale pour la détection hors distribution en zéro-shot Contexte de recherche et problématique Dans les environnements réels d’application des modèles d’apprentissage automatique, les données peuvent souvent présenter des changements dans leur distribution, par exemple l’apparition de nouvelles catégories...

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Amélioration des performances de la détection d’objets 3D centrée sur la vision grâce à une méthode de pré-entraînement géométrique guidée par LiDAR Introduction Ces dernières années, la détection d’objets 3D multi-caméras dans le domaine de la conduite autonome a suscité une attention considérable. Cependant, les méthodes basées sur la vision renc...