À l’aide d’un moteur de simulation photoréaliste, les véhicules apprennent à conduire dans le monde réel et à se remettre de scénarios de quasi-collision –

  • FrançaisFrançais



  • Un système de simulation inventé au MIT pour former des voitures sans conducteur crée un monde photoréaliste avec des possibilités de direction infinies, aidant les voitures à apprendre à naviguer dans une foule de scénarios pires avant de dévaler dans de vraies rues.

    Les systèmes de contrôle, ou «contrôleurs», pour les véhicules autonomes reposent largement sur des ensembles de données du monde réel sur les trajectoires de conduite des conducteurs humains. À partir de ces données, ils apprennent à émuler des commandes de direction sûres dans diverses situations. Mais les données du monde réel provenant de «cas extrêmes» dangereux, tels que presque s’écraser ou être forcé de quitter la route ou dans d’autres voies, sont – heureusement – rares.

    Certains programmes informatiques, appelés «moteurs de simulation», visent à imiter ces situations en rendant des routes virtuelles détaillées pour aider à entraîner les contrôleurs à récupérer. Mais il n’a jamais été démontré que le contrôle appris de la simulation se transforme en réalité sur un véhicule grandeur nature.

    Les chercheurs du MIT s’attaquent au problème avec leur simulateur photoréaliste, appelé Virtual Image Synthesis and Transformation for Autonomy (VISTA). Il n’utilise qu’un petit ensemble de données, capturé par des humains conduisant sur une route, pour synthétiser un nombre pratiquement infini de nouveaux points de vue à partir de trajectoires que le véhicule pourrait emprunter dans le monde réel. Le contrôleur est récompensé pour la distance parcourue sans s’écraser, il doit donc apprendre par lui-même comment atteindre une destination en toute sécurité. Ce faisant, le véhicule apprend à naviguer en toute sécurité dans toutes les situations qu’il rencontre, y compris en reprenant le contrôle après avoir dévié entre les voies ou après une quasi-collision.

    Lors de tests, un contrôleur formé au simulateur VISTA a pu être déployé en toute sécurité sur une voiture sans conducteur à grande échelle et naviguer dans des rues auparavant invisibles. En positionnant la voiture à des orientations hors route qui imitaient diverses situations de quasi-collision, le contrôleur a également pu récupérer avec succès la voiture dans une trajectoire de conduite sûre en quelques secondes. Un article décrivant le système a été publié dans Lettres de robotique et d’automatisation IEEE et sera présenté à la prochaine conférence de l’ICRA en mai.

    «Il est difficile de collecter des données dans ces cas extrêmes que les humains ne connaissent pas sur la route», déclare le premier auteur Alexander Amini, doctorant au Laboratoire d’informatique et d’intelligence artificielle (CSAIL). “Dans notre simulation, cependant, les systèmes de contrôle peuvent expérimenter ces situations, apprendre par eux-mêmes à s’en remettre et rester robustes lorsqu’ils sont déployés sur des véhicules dans le monde réel.”

    Le travail a été réalisé en collaboration avec le Toyota Research Institute. Rejoindre Amini sur le papier sont Igor Gilitschenski, un postdoc au CSAIL; Jacob Phillips, Julia Moseyko et Rohan Banerjee, tous étudiants de premier cycle au CSAIL et au Département de génie électrique et d’informatique; Sertac Karaman, professeur agrégé d’aéronautique et d’astronautique; et Daniela Rus, directrice du CSAIL et du professeur Andrew et Erna Viterbi de génie électrique et d’informatique.

    Simulation basée sur les données

    Historiquement, la construction de moteurs de simulation pour la formation et le test de véhicules autonomes était en grande partie une tâche manuelle. Les entreprises et les universités emploient souvent des équipes d’artistes et d’ingénieurs pour esquisser des environnements virtuels, avec des marquages ​​routiers précis, des voies et même des feuilles détaillées sur les arbres. Certains moteurs peuvent également intégrer la physique de l’interaction d’une voiture avec son environnement, basée sur des modèles mathématiques complexes.

    Mais comme il y a tellement de choses différentes à considérer dans des environnements complexes du monde réel, il est pratiquement impossible de tout incorporer dans le simulateur. Pour cette raison, il y a généralement un décalage entre ce que les contrôleurs apprennent en simulation et comment ils fonctionnent dans le monde réel.

    Au lieu de cela, les chercheurs du MIT ont créé ce qu’ils appellent un moteur de simulation «basé sur les données» qui synthétise, à partir de données réelles, de nouvelles trajectoires cohérentes avec l’apparence de la route, ainsi que la distance et le mouvement de tous les objets de la scène.

    Ils collectent d’abord les données vidéo d’un humain conduisant sur quelques routes et les alimentent dans le moteur. Pour chaque image, le moteur projette chaque pixel dans un type de nuage de points 3D. Ensuite, ils placent un véhicule virtuel à l’intérieur de ce monde. Lorsque le véhicule émet une commande de direction, le moteur synthétise une nouvelle trajectoire à travers le nuage de points, en fonction de la courbe de direction et de l’orientation et de la vitesse du véhicule.

    Ensuite, le moteur utilise cette nouvelle trajectoire pour rendre une scène photoréaliste. Pour ce faire, il utilise un réseau de neurones convolutifs – couramment utilisé pour les tâches de traitement d’image – pour estimer une carte de profondeur, qui contient des informations relatives à la distance des objets du point de vue du contrôleur. Il combine ensuite la carte de profondeur avec une technique qui estime l’orientation de la caméra dans une scène 3D. Tout cela aide à localiser l’emplacement du véhicule et la distance relative de tout ce qui se trouve dans le simulateur virtuel.

    Sur la base de ces informations, il réoriente les pixels d’origine pour recréer une représentation 3D du monde à partir du nouveau point de vue du véhicule. Il suit également le mouvement des pixels pour capturer le mouvement des voitures et des personnes, ainsi que d’autres objets en mouvement, dans la scène. «Cela équivaut à fournir au véhicule un nombre infini de trajectoires possibles», explique Rus. «Parce que lorsque nous collectons des données physiques, nous obtenons des données sur la trajectoire spécifique que suivra la voiture. Mais nous pouvons modifier cette trajectoire pour couvrir tous les modes et environnements de conduite possibles. C’est vraiment puissant.

    Apprentissage par renforcement à partir de zéro

    Traditionnellement, les chercheurs entraînent des véhicules autonomes en suivant des règles de conduite définies par l’homme ou en essayant d’imiter les conducteurs humains. Mais les chercheurs font en sorte que leur contrôleur apprenne entièrement à partir de zéro dans un cadre «de bout en bout», ce qui signifie qu’il ne prend en entrée que des données brutes de capteur – telles que des observations visuelles de la route – et, à partir de ces données, prédit les commandes de direction aux sorties.

    “Nous disons en gros:” Voici un environnement. Vous pouvez faire ce que vous voulez. Ne vous écrasez pas dans les véhicules et restez dans les voies “”, explique Amini.

    Cela nécessite un «apprentissage par renforcement» (RL), une technique d’apprentissage automatique par essais et erreurs qui fournit des signaux de rétroaction chaque fois que la voiture fait une erreur. Dans le moteur de simulation des chercheurs, le contrôleur commence par ne rien savoir sur la façon de conduire, à quoi ressemble un marqueur de voie ou même à d’autres véhicules, il commence donc à exécuter des angles de direction aléatoires. Il ne reçoit un signal de retour que lorsqu’il se bloque. À ce stade, il est téléporté vers un nouvel emplacement simulé et doit exécuter un meilleur ensemble d’angles de direction pour éviter de s’écraser à nouveau. Au cours de 10 à 15 heures de formation, il utilise ces signaux de retour clairsemés pour apprendre à parcourir de plus en plus de distances sans s’écraser.

    Après avoir parcouru 10000 kilomètres avec succès en simulation, les auteurs appliquent ce contrôleur appris à leur véhicule autonome à grande échelle dans le monde réel. Les chercheurs affirment que c’est la première fois qu’un contrôleur formé à l’aide de l’apprentissage par renforcement de bout en bout en simulation est déployé avec succès sur une voiture autonome à grande échelle. “Cela nous a surpris. Non seulement le contrôleur n’a jamais été sur une vraie voiture auparavant, mais il n’a même jamais vu les routes auparavant et n’a aucune connaissance préalable de la conduite des humains”, dit Amini.

    Le fait de forcer le contrôleur à parcourir tous les types de scénarios de conduite lui a permis de reprendre le contrôle de positions désorientantes – comme être à moitié sur la route ou dans une autre voie – et de revenir dans la bonne voie en quelques secondes. «Et d’autres contrôleurs à la pointe de la technologie ont tous tragiquement échoué à cela, car ils n’ont jamais vu de données comme celle-ci à l’entraînement», dit Amini.

    Ensuite, les chercheurs espèrent simuler tous les types de conditions routières à partir d’une seule trajectoire de conduite, comme la nuit et le jour, et le temps ensoleillé et pluvieux. Ils espèrent également simuler des interactions plus complexes avec d’autres véhicules sur la route. “Et si d’autres voitures se mettent à bouger et sautent devant le véhicule?” Dit Rus. “Ce sont des interactions complexes et réelles que nous voulons commencer à tester.”

    Source

    N'oubliez pas de voter pour cet article !
    1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
    Loading...

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.