Sciences de l'information-Discipline-FmRead Avant-garde Académique

DiffuVolume - Une nouvelle méthode de stéréo matching basée sur le modèle de diffusion Contexte de recherche et problématique Le stéréo matching (Stereo Matching) est une tâche essentielle dans le domaine de la vision par ordinateur, avec des applications largement répandues dans les domaines de la conduite autonome et de la navigation robotique. S...

Améliorer la perception des poses dans l’apprentissage autodidacte de représentations faciales Contexte de recherche et problématique Dans le domaine de la vision par ordinateur, l’apprentissage des représentations faciales (Facial Representation Learning) est une tâche importante. En analysant les images faciales, nous pouvons extraire des informa...

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Un cadre de supervision mutuelle pour la segmentation et la génération d’expressions référentielles Contexte de recherche et problématique Ces dernières années, les technologies d’interaction vision-langage ont connu des progrès significatifs dans le domaine de l’intelligence artificielle. Parmi elles, la segmentation d’expressions référentielles (...

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

GL-MCM : Correspondance maximale globale et locale pour la détection hors distribution en zéro-shot Contexte de recherche et problématique Dans les environnements réels d’application des modèles d’apprentissage automatique, les données peuvent souvent présenter des changements dans leur distribution, par exemple l’apparition de nouvelles catégories...

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Amélioration des performances de la détection d’objets 3D centrée sur la vision grâce à une méthode de pré-entraînement géométrique guidée par LiDAR Introduction Ces dernières années, la détection d’objets 3D multi-caméras dans le domaine de la conduite autonome a suscité une attention considérable. Cependant, les méthodes basées sur la vision renc...

Une étude expérimentale sur l’exploration de puissants transformateurs visuels légers via le pré-entraînement par modélisation d’image masquée Contexte académique Ces dernières années, l’apprentissage auto-supervisé (self-supervised learning, SSL) a fait des progrès significatifs dans le domaine de la vision par ordinateur. En particulier, la métho...

DiffuVolume : Modèle de diffusion pour l'appariement stéréo basé sur le volume

Apprentissage de la représentation faciale cohésive et consciente de la posture par apprentissage contrastif

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Une étude expérimentale sur l'exploration de transformateurs de vision légers robustes via un pré-entraînement par modélisation d'image masquée