Une IA capable d’apprendre les causes et les effets : ces réseaux de neurones savent ce qu’ils font

Concept d'IA d'apprentissage automatique

Un certain type d’agent d’intelligence artificielle peut apprendre la base de cause à effet d’une tâche de navigation pendant la formation.

Les réseaux de neurones peut apprendre à résoudre toutes sortes de problèmes, de l’identification des chats sur les photos à la conduite d’une voiture autonome. Mais la question de savoir si ces puissants algorithmes de reconnaissance de modèles comprennent réellement les tâches qu’ils effectuent reste une question ouverte.

Par exemple, un réseau neuronal chargé de garder une voiture autonome dans sa voie pourrait apprendre à le faire en observant les buissons au bord de la route, plutôt que d’apprendre à détecter les voies et à se concentrer sur l’horizon de la route.

Les chercheurs de AVEC ont maintenant montré qu’un certain type de réseau de neurones est capable d’apprendre la véritable structure de cause à effet de la tâche de navigation pour laquelle il est entraîné. Étant donné que ces réseaux peuvent comprendre la tâche directement à partir de données visuelles, ils devraient être plus efficaces que les autres réseaux de neurones lors de la navigation dans un environnement complexe, comme un endroit avec des arbres denses ou des conditions météorologiques changeant rapidement.

À l’avenir, ce travail pourrait améliorer la fiabilité et la fiabilité des agents d’apprentissage automatique qui effectuent des tâches à enjeux élevés, comme conduire un véhicule autonome sur une autoroute très fréquentée.

Navigation de réseau de neurones d'apprentissage en profondeur

Des chercheurs du MIT ont démontré qu’une classe spéciale de réseaux de neurones d’apprentissage en profondeur est capable d’apprendre la véritable structure de cause à effet d’une tâche de navigation pendant la formation. Crédit: Image d’archive

« Parce que ces systèmes d’apprentissage automatique sont capables de raisonner de manière causale, nous pouvons savoir et indiquer comment ils fonctionnent et prennent des décisions. Ceci est essentiel pour les applications critiques pour la sécurité », explique le co-auteur principal Ramin Hasani, post-doctorant au Laboratoire d’informatique et d’intelligence artificielle (CSAIL).

Les co-auteurs comprennent un étudiant diplômé en génie électrique et en informatique et co-auteur principal Charles Vorbach; Le doctorant CSAIL Alexander Amini ; Mathias Lechner, étudiant diplômé de l’Institut des sciences et technologies d’Autriche; et auteur principal Daniela Rus, professeur Andrew et Erna Viterbi de génie électrique et d’informatique et directeur de CSAIL. La recherche sera présentée à la conférence 2021 sur les systèmes de traitement de l’information neuronale (NeurIPS) en décembre.

Un résultat accrocheur

Les réseaux de neurones sont une méthode d’apprentissage automatique dans laquelle l’ordinateur apprend à effectuer une tâche par essais et erreurs en analysant de nombreux exemples de formation. Et les réseaux de neurones «liquides» modifient leurs équations sous-jacentes pour s’adapter en permanence aux nouvelles entrées.

La nouvelle recherche s’appuie sur des travaux antérieurs dans lesquels Hasani et d’autres ont montré comment un type de système d’apprentissage en profondeur inspiré par le cerveau appelé un Politique de circuit neuronal (NCP), construit par des cellules de réseau de neurones liquides, est capable de contrôler de manière autonome un véhicule autonome, avec un réseau de seulement 19 neurones de contrôle.

Les chercheurs ont observé que les PCN effectuant une tâche de maintien de voie gardaient leur attention sur l’horizon et les frontières de la route lorsqu’ils prenaient une décision de conduite, de la même manière qu’un humain le ferait (ou devrait) en conduisant une voiture. Les autres réseaux neuronaux qu’ils ont étudiés ne se sont pas toujours concentrés sur la route.

« C’était une observation intéressante, mais nous ne l’avons pas quantifiée. Nous voulions donc trouver les principes mathématiques expliquant pourquoi et comment ces réseaux sont capables de capturer la véritable causalité des données », dit-il.

Ils ont découvert que, lorsqu’un PCN est formé pour accomplir une tâche, le réseau apprend à interagir avec l’environnement et à rendre compte des interventions. Essentiellement, le réseau reconnaît si sa sortie est modifiée par une certaine intervention, puis relie la cause et l’effet ensemble.

Pendant la formation, le réseau est exécuté en avant pour générer une sortie, puis en arrière pour corriger les erreurs. Les chercheurs ont observé que les PCN établissent une relation de cause à effet en mode avant et en mode arrière, ce qui permet au réseau de porter une attention très ciblée sur la véritable structure causale d’une tâche.

Hasani et ses collègues n’avaient pas besoin d’imposer de contraintes supplémentaires au système ou d’effectuer une configuration spéciale pour que le PCN apprenne cette causalité.

« La causalité est particulièrement importante à caractériser pour les applications critiques pour la sécurité telles que le vol », explique Rus. “Notre travail démontre les propriétés de causalité des politiques de circuits neuronaux pour la prise de décision en vol, y compris le vol dans des environnements avec des obstacles denses tels que les forêts et le vol en formation.”

Altération des changements environnementaux

Ils ont testé les PCN à travers une série de simulations dans lesquelles des drones autonomes effectuaient des tâches de navigation. Chaque drone utilisait les entrées d’une seule caméra pour naviguer.

Les drones étaient chargés de se rendre vers un objet cible, de poursuivre une cible en mouvement ou de suivre une série de marqueurs dans des environnements variés, notamment une forêt de séquoias et un quartier. Ils ont également voyagé dans différentes conditions météorologiques, comme un ciel clair, de fortes pluies et du brouillard.

Les chercheurs ont découvert que les NCP fonctionnaient aussi bien que les autres réseaux sur des tâches plus simples par beau temps, mais les surpassaient tous sur les tâches les plus difficiles, telles que la poursuite d’un objet en mouvement à travers une tempête de pluie.

«Nous avons observé que les PCN sont le seul réseau qui prête attention à l’objet d’intérêt dans différents environnements tout en effectuant la tâche de navigation, partout où vous le testez et dans différentes conditions d’éclairage ou d’environnement. C’est le seul système qui peut faire cela avec désinvolture et apprendre réellement le comportement que nous voulons que le système apprenne », dit-il.

Leurs résultats montrent que l’utilisation de NCP pourrait également permettre aux drones autonomes de naviguer avec succès dans des environnements aux conditions changeantes, comme un paysage ensoleillé qui devient soudainement brumeux.

« Une fois que le système a appris ce qu’il est réellement censé faire, il peut bien fonctionner dans de nouveaux scénarios et conditions environnementales qu’il n’a jamais connus. C’est un grand défi des systèmes d’apprentissage automatique actuels qui ne sont pas causals. Nous pensons que ces résultats sont très excitants, car ils montrent comment la causalité peut émerger du choix d’un réseau de neurones », dit-il.

À l’avenir, les chercheurs souhaitent explorer l’utilisation des PCN pour construire des systèmes plus grands. La mise en place de milliers ou de millions de réseaux pourrait leur permettre de s’attaquer à des tâches encore plus complexes.

Référence : « Causal Navigation by Continuous-time Neural Networks » par Charles Vorbach, Ramin Hasani, Alexander Amini, Mathias Lechner et Daniela Rus, 15 juin 2021, Informatique > Apprentissage automatique.
arXiv:2106.08314

Cette recherche a été soutenue par le United States Air Force Research Laboratory, l’accélérateur d’intelligence artificielle de l’US Air Force et la société Boeing.

Leave a Comment