Explorer la psychologie du raisonnement moral et juridique des LLM

Aujourd’hui, les grands modèles de langage (LLM) démontrent des performances de niveau expert dans de multiples domaines, suscitant un vif intérêt pour comprendre leurs processus de raisonnement internes. Comprendre comment les LLM produisent ces résultats étonnants est crucial pour le développement futur des agents d’intelligence artificielle et p...

Atténuation des biais sociaux des modèles de langue pré-entraînés via un auto-désanoblissement contrastif avec une double augmentation de données

Introduction : Actuellement, les modèles de langue pré-entraînés (PLM) sont largement utilisés dans le domaine du traitement du langage naturel, mais ils ont le problème d’hériter et d’amplifier les préjugés sociaux présents dans les données d’entraînement. Les préjugés sociaux peuvent entraîner des risques imprévisibles lors de l’application réell...

Un paradigme unifié basé sur la dynamique de SGD décentralisé pour les modèles non convexes et les données hétérogènes

Un paradigme de moment unifié pour résoudre les problèmes SGD décentralisés sous des modèles non convexes et des environnements de données hétérogènes Introduction Ces dernières années, avec l’émergence de l’Internet des objets et de l’informatique edge, l’apprentissage machine distribué a connu un développement rapide, en particulier le paradigme ...

Acquérir et modéliser les connaissances de sens commun abstrait via la conceptualisation

Introduction Le manque de connaissances de sens commun des systèmes d’intelligence artificielle a longtemps été l’un des principaux goulots d’étranglement entravant le développement de ce domaine. Bien que des progrès considérables aient été réalisés ces dernières années grâce aux modèles de langue neuronaux et aux graphes de connaissances de sens ...

Une représentation multi-graphique pour l'extraction d'événements

Introduction: L’extraction d’événements est une tâche populaire dans le domaine du traitement du langage naturel, visant à identifier les mots déclencheurs d’événements et leurs arguments associés à partir d’un texte donné. Cette tâche est généralement divisée en deux sous-tâches: la détection d’événements (extraction des mots déclencheurs d’événem...

Un cadre d'architecture cognitive neurosymbolique pour gérer les nouveautés dans les mondes ouverts

Un cadre d'architecture cognitive neurosymbolique pour gérer les nouveautés dans les mondes ouverts

Un cadre d’architecture cognitive neuronale-symbolique pour traiter les nouveautés dans un monde ouvert Contexte de l’article La recherche traditionnelle en intelligence artificielle suppose que les agents intelligents fonctionnent dans un “monde fermé”, où tous les concepts pertinents pour la tâche sont connus, sans rencontrer de nouvelles situati...