Un cadre de transfert de connaissances assisté par mémoire avec anticipation curriculaire pour la détection d'activités en ligne faiblement supervisée

Contexte et pertinence de l’étude Ces dernières années, la détection d’activités en ligne faiblement supervisée (Weakly Supervised Online Activity Detection, WS-OAD), en tant que sujet important de compréhension vidéo avancée, a suscité une attention croissante. Son objectif principal est de détecter image par image les activités en cours dans des ...

Réseau Transformer Vision-Langage avec Attention Dynamique pour la Ré-Identification des Personnes

Rapport de recherche sur le réseau Transformer vision-langage à attention dynamique pour la réidentification de personnes Ces dernières années, la technologie de réidentification de personnes multimodale (Person Re-Identification, ReID) a suscité un intérêt croissant dans le domaine de la vision par ordinateur. La réidentification de personnes vise...

StyleAdapter : Un modèle unifié de génération d'images stylisées

StyleAdapter : un modèle unifié de génération d’images stylisées Ces dernières années, les avancées des technologies de génération d’images à partir de texte (Text-to-Image, T2I) et des modèles d’apprentissage profond ont considérablement stimulé les progrès dans la recherche sur la vision artificielle. Cependant, intégrer un style spécifique d’une...

Corrélation d'échantillons pour l'empreinte digitale de la reconnaissance faciale profonde

Détection et protection contre le vol de modèles dans la reconnaissance faciale profonde : une étude innovante basée sur la corrélation des échantillons Contexte et problématique Les progrès rapides des techniques d’apprentissage profond ont considérablement stimulé le domaine de la reconnaissance faciale ces dernières années. Toutefois, les modèle...

Une méthode basée sur l'incertitude de déplacement pour le suivi multi-objets dans des vidéos à faible fréquence d'images

Rapport académique : Suivi multi-objets à basse fréquence d’images Introduction et contexte de recherche Ces dernières années, le suivi multi-objets (MOT) s’est imposé comme une technologie clé dans des domaines tels que la surveillance vidéo intelligente, la conduite autonome et la vision robotique. Cependant, les méthodes MOT conventionnelles son...

Vaccin Anti-Faux : Protéger la Vie Privée Contre les Échanges de Visages par une Double Dégradation Visuelle et Sémantique

Rapport Académique: Protection de la Vie Privée Contre les Profondeurs Faux Grâce au « Anti-Fake Vaccine » Introduction et Motivation Ces dernières années, les techniques de faux profonds (deepfake) ont présenté des défis importants à la confidentialité personnelle et à la sécurité sociale. Les techniques de substitution de visage, largement utilis...