Apprentissage par renforcement multi-agents déterministe distribué basé sur le consensus de politique

Rapport de recherche sur l’apprentissage par renforcement multi-agent déterministe distribué basé sur le consensus de politique L’apprentissage par renforcement (Reinforcement Learning, RL) a fait des avancées significatives ces dernières années dans divers domaines, notamment la robotique, les réseaux électriques intelligents et la conduite autono...

Un modèle de prévision de prix de l'électricité amélioré et explicable via une approche de compensation des erreurs basée sur SHAP

Étude sur l’amélioration et l’explicabilité d’un modèle de prévision des prix de l’électricité basé sur SHAP Contexte et motivation de la recherche Les modèles de prévision des prix de l’électricité dans les marchés électriques sont devenus des sujets de recherche majeurs ces dernières années, notamment en raison de l’impact financier des fluctuati...

Optimisation multiobjectif flexible et dynamique pour un atelier avec des objectifs biaisés via la programmation génétique multitâche

Recherche révolutionnaire sur l’ordonnancement dynamique multiobjectif flexible des ateliers : une nouvelle méthode pour optimiser les préférences d’objectifs via l’apprentissage multitâche dans la programmation génétique Introduction à l’arrière-plan L’ordonnancement dynamique flexible des ateliers (Dynamic Flexible Job Shop Scheduling, DFJSS) est...

NPE-DRL : Approche d'évitement d'obstacles contraints à la perception avec apprentissage par renforcement guidé par une politique non experte

Recherche sur l’amélioration des capacités d’évitement d’obstacles de drones dans des environnements à perception visuelle limitée basée sur l’apprentissage par renforcement guidé par des stratégies non expertes Ces dernières années, les drones (Unmanned Aerial Vehicle, UAV) ont été largement utilisés dans des domaines civils tels que la livraison ...

Implémentations efficaces des fonctions d'activation basées sur CORDIC pour l'accélération des RNN sur FPGA

Mise en œuvre efficace des fonctions d’activation RNN : percée dans l’algorithme CORDIC et l’accélération matérielle FPGA Contexte et importance de l’étude Ces dernières années, avec le développement rapide des technologies d’apprentissage profond, les réseaux neuronaux récurrents (Recurrent Neural Networks, RNN), en particulier les réseaux à mémoi...