Moins de neurones, plus d’intelligence –

L’intelligence artificielle est arrivée dans notre vie quotidienne – des moteurs de recherche aux voitures autonomes. Cela a à voir avec l’énorme puissance de calcul qui est devenue disponible ces dernières années. Mais de nouveaux résultats de la recherche sur l’IA montrent maintenant que des réseaux de neurones plus simples et plus petits peuvent être utilisés pour résoudre certaines tâches encore mieux, plus efficacement et de manière plus fiable que jamais.
Une équipe de recherche internationale de la TU Wien (Vienne), de l’IST Autriche et du MIT (États-Unis) a développé un nouveau système d’intelligence artificielle basé sur le cerveau de petits animaux, comme les vers filiformes. Ce nouveau système d’IA peut contrôler un véhicule avec seulement quelques neurones artificiels. L’équipe affirme que le système présente des avantages décisifs par rapport aux modèles d’apprentissage en profondeur précédents: il gère beaucoup mieux les entrées bruyantes et, en raison de sa simplicité, son mode de fonctionnement peut être expliqué en détail. Il ne doit pas être considéré comme une «boîte noire» complexe, mais il peut être compris par les humains. Ce nouveau modèle d’apprentissage en profondeur a maintenant été publié dans la revue Intelligence artificielle de la nature.
Apprendre de la nature
Semblables aux cerveaux vivants, les réseaux de neurones artificiels sont constitués de nombreuses cellules individuelles. Lorsqu’une cellule est active, elle envoie un signal aux autres cellules. Tous les signaux reçus par la cellule suivante sont combinés pour décider si cette cellule deviendra également active. La manière dont une cellule influence l’activité de la suivante détermine le comportement du système – ces paramètres sont ajustés dans un processus d’apprentissage automatique jusqu’à ce que le réseau neuronal puisse résoudre une tâche spécifique.
«Depuis des années, nous étudions ce que nous pouvons apprendre de la nature pour améliorer l’apprentissage en profondeur», déclare le professeur Radu Grosu, chef du groupe de recherche «Cyber-Physical Systems» à TU Wien. “Le nématode C. elegans, par exemple, vit sa vie avec un nombre étonnamment petit de neurones, et présente toujours des modèles de comportement intéressants. Cela est dû à la manière efficace et harmonieuse dont le système nerveux du nématode traite les informations.”
«La nature nous montre qu’il reste encore beaucoup à faire», déclare le professeur Daniela Rus, directeur du laboratoire d’informatique et d’intelligence artificielle du MIT (CSAIL). “Par conséquent, notre objectif était de réduire massivement la complexité et d’améliorer l’interprétabilité des modèles de réseaux neuronaux.”
«Inspirés par la nature, nous avons développé de nouveaux modèles mathématiques de neurones et de synapses», déclare le professeur Thomas Henzinger, président de l’IST Autriche.
«Le traitement des signaux au sein des cellules individuelles suit des principes mathématiques différents de ceux des modèles d’apprentissage en profondeur précédents», explique le Dr Ramin Hasani, postdoctoral associé à l’Institut de génie informatique, TU Wien et MIT CSAIL. “De plus, nos réseaux sont très clairsemés – cela signifie que toutes les cellules ne sont pas connectées à toutes les autres cellules. Cela simplifie également le réseau.”
Maintien de voie autonome
Pour tester les nouvelles idées, l’équipe a choisi une tâche de test particulièrement importante: les voitures autonomes restant dans leur voie. Le réseau neuronal reçoit en entrée des images de caméra de la route et décide automatiquement de se diriger vers la droite ou vers la gauche.
«Aujourd’hui, des modèles d’apprentissage profond avec plusieurs millions de paramètres sont souvent utilisés pour apprendre des tâches complexes telles que la conduite autonome», explique Mathias Lechner, ancien élève de la TU Wien et doctorant à l’IST Autriche. “Cependant, notre nouvelle approche nous permet de réduire la taille des réseaux de deux ordres de grandeur. Nos systèmes n’utilisent que 75 000 paramètres entraînables.”
Alexander Amini, doctorant au MIT CSAIL explique que le nouveau système se compose de deux parties: L’entrée de la caméra est d’abord traitée par un réseau neuronal dit convolutif, qui ne perçoit que les données visuelles pour extraire les caractéristiques structurelles des pixels entrants. Ce réseau décide quelles parties de l’image de la caméra sont intéressantes et importantes, puis transmet les signaux à la partie cruciale du réseau – un «système de contrôle» qui dirige ensuite le véhicule.
Les deux sous-systèmes sont empilés et sont entraînés simultanément. De nombreuses heures de vidéos de circulation sur la conduite humaine dans la grande région de Boston ont été collectées et sont transmises au réseau, avec des informations sur la façon de diriger la voiture dans une situation donnée – jusqu’à ce que le système ait appris à connecter automatiquement les images avec les direction de direction et peut gérer indépendamment de nouvelles situations.
La partie contrôle du système (appelée politique de circuit neuronal, ou NCP), qui traduit les données du module de perception en une commande de pilotage, ne se compose que de 19 neurones. Mathias Lechner explique que les PCN sont jusqu’à 3 ordres de grandeur plus petits que ce qui aurait été possible avec les modèles de pointe précédents.
Causalité et interprétabilité
Le nouveau modèle d’apprentissage en profondeur a été testé sur un véritable véhicule autonome. «Notre modèle nous permet d’étudier ce sur quoi le réseau concentre son attention pendant la conduite. Nos réseaux se concentrent sur des parties très spécifiques de l’image de la caméra: le trottoir et l’horizon. Ce comportement est hautement souhaitable, et il est unique parmi les systèmes d’intelligence artificielle, “dit Ramin Hasani. “De plus, nous avons vu que le rôle de chaque cellule dans n’importe quelle décision de conduite peut être identifié. Nous pouvons comprendre la fonction des cellules individuelles et leur comportement. Atteindre ce degré d’interprétabilité est impossible pour les modèles d’apprentissage en profondeur plus larges.”
Robustesse
«Pour tester la robustesse des PCN par rapport aux modèles profonds précédents, nous avons perturbé les images d’entrée et évalué la capacité des agents à gérer le bruit», explique Mathias Lechner. “Alors que cela est devenu un problème insurmontable pour d’autres réseaux neuronaux profonds, nos PCN ont démontré une forte résistance aux artefacts d’entrée. Cet attribut est une conséquence directe du nouveau modèle neuronal et de l’architecture.”
«L’interprétabilité et la robustesse sont les deux avantages majeurs de notre nouveau modèle», déclare Ramin Hasani. «Mais il y a plus: en utilisant nos nouvelles méthodes, nous pouvons également réduire le temps de formation et la possibilité de mettre en œuvre l’IA dans des systèmes relativement simples. Nos PCN permettent l’apprentissage par imitation dans un large éventail d’applications possibles, du travail automatisé dans les entrepôts à la locomotion par robot. Les nouvelles découvertes ouvrent de nouvelles perspectives importantes pour la communauté de l’IA: les principes du calcul dans les systèmes nerveux biologiques peuvent devenir une excellente ressource pour créer une IA interprétable de haute performance – comme une alternative aux systèmes d’apprentissage automatique de la boîte noire que nous avons utilisés. loin.”
Référentiel de code: https://github.com/mlech26l/keras-ncp