La récompense n’est peut-être PAS suffisante pour AGI – mais cela vaut la peine d’essayer


  • FrançaisFrançais


  • DeepMind est connecté à l’intelligence artificielle générale depuis sa naissance.

    Le laboratoire a été lancé avec une mission à develop AGI, a été cofondé par un chercheur qui a inventé le termeet a fait quelques avancées convaincantes Sur le terrain.

    Il a également récemment publié un article provocateur sur le sujet : «La récompense suffit

    L’étude émet l’hypothèse que l’AGI pourrait être atteint par une seule approche: l’apprentissage par renforcement.

    Cette technique fournit une rétroaction sous la forme d’une “récompense” – un nombre positif qui indique à un algorithme que l’action qu’il vient d’effectuer bénéficiera à son objectif.

    L’approche s’est révélée prometteuse dans des programmes tels que MuZero, qui maîtrisaient plusieurs jeux maîtrisaient plusieurs jeux sans connaître leurs règles. DeepMind a qualifié le système de “pas en avant significatif dans la recherche d’algorithmes à usage général”.

    “La récompense suffit” suggère que l’apprentissage par renforcement seul pourrait conduire à l’AGI.

    Cette théorie a été contestée par de nombreux informaticiens, dont certains chez DeepMind. Mais Doina Precup, l’un des co-auteurs de l’article, a déclaré à TNW que l’étude visait simplement à sonder les possibilités.

    « VousEn fin de compte, nous voulons tester cela comme une hypothèse et y penser également dans le contexte d’autres méthodes », a déclaré Precup, qui dirige le bureau de DeepMind à Montréal.

    En effet, l’apprentissage par renforcement n’est qu’une des pistes qu’explore la filiale d’Alphabet. Dans un nouvel épisode du Podcast DeepMindles chercheurs du laboratoire discutent de la promesse de diverses voies vers l’IAG.

    Parmi les sceptiques de la récompense, c’est assez se trouve Raia Hadsell, directrice de la robotique de l’entreprise, qui note la difficulté de concevoir une récompense toute-puissante qui mène à l’IAG. Le cofondateur de DeepMind, Shane Legg, soupçonne que l’apprentissage par renforcement pourrait devoir se combiner avec des algorithmes d’apprentissage.

    Precup doute également que la récompense seule suffise, mais elle pense que cela pourrait être un ingrédient crucial de l’AGI.

    “Parce qu’il apprend de l’interaction de manière progressive, cela ressemble beaucoup à ce que font les systèmes d’intelligence biologique”, a-t-elle déclaré.

    « Est-ce que ce sera en fin de compte la seule technologie qui contribuera à l’AGI ? Eh bien, ce n’est pas clair du tout – il y a beaucoup d’autres choses vraiment intéressantes qui se passent.

    Precup est néanmoins optimiste sur le fait que nous sommes déjà sur la voie de l’AGI. En fin de compte, elle est plus préoccupée par la sécurité de la destination que par l’itinéraire qui nous y emmène.

    “The road to AGI”, le cinquième épisode de la saison deux de “DeepMind: The Podcast”, est disponible ici à partir du 15 février.

    Source

    La Rédaction

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

    Copy code