Généralisation hors distribution par composition : une perspective à travers les têtes d'induction dans les transformateurs

Étude sur la généralisation hors distribution et les mécanismes de composition dans les grands modèles de langage Contexte du papier Ces dernières années, les grands modèles de langage (Large Language Models, LLMs) comme GPT-4 ont montré une créativité étonnante dans la résolution de tâches nouvelles, en étant souvent capables de résoudre des probl...

Conception adaptative de critique stable avec escompte pour les jeux à somme nulle avec vérifications d'application

Conception de jugement adaptatif basée sur l’itération de valeur discountée dans les jeux à somme nulle : application et validation Contexte de recherche Dans le domaine du contrôle, le contrôle optimal (Optimal Control) est un axe de recherche central visant à concevoir et analyser des systèmes de contrôle pour optimiser les performances du systèm...

Planificateur séquentiel décentralisé économe en ressources pour l'atténuation spatio-temporelle des feux de forêt

Planificateur séquentiel décentralisé efficace basé sur des drones multiples pour la prévention et le contrôle des feux de forêt spatio-temporels Contexte académique Les feux de forêt constituent une menace majeure pour la biodiversité et la durabilité des ressources à l’échelle mondiale, en particulier dans leurs phases initiales. S’ils ne sont pa...

Une approche de surveillance basée sur le DTW pondéré projectif pour les processus multi-étapes avec des durées inégales

Méthode de surveillance par alignement dynamique pondéré projectif pour les processus multi-étapes de durées inégales Contexte académique Dans l’industrie manufacturière moderne, la surveillance en ligne des processus multi-étapes (tels que les traitements par lots et les processus de transition) est cruciale pour améliorer la qualité des produits ...

Modèle efficace de réseaux de neurones probabilistes pour l'apprentissage par renforcement basé sur modèle dans les USV

Nouvelle méthode de contrôle prédictif pour les véhicules de surface sans pilote (USV) : Cadre MBRL basé sur les réseaux de neurones probabilistes Contexte académique Les véhicules de surface sans pilote (Unmanned Surface Vehicles, USV) ont connu un développement rapide ces dernières années dans le domaine des sciences marines, étant largement util...

Apprentissage semi-supervisé informé par les connaissances anatomiques orales pour la segmentation 3D des CBCT dentaires et la détection des lésions

Contexte académique et motivation de la recherche Dans le domaine des soins dentaires, la tomodensitométrie à faisceau conique (CBCT, Cone Beam Computed Tomography) est une technique d’imagerie tridimensionnelle largement utilisée. Le CBCT permet de fournir des images 3D de la cavité buccale, en particulier pour le diagnostic des lésions d’origine ...