DeepMind se querelle avec des scientifiques russes à propos de la recherche sur l’IA quantique


  • FrançaisFrançais



  • Il n’y a rien de plus dramatique et inspirant qu’une percée scientifique. Mais que se passe-t-il lorsque différents groupes de scientifiques ne semblent pas s’entendre sur la science ?

    DeepMind, une société de recherche Alphabet basée à Londres, a publié l’année dernière un document de recherche fascinant dans lequel elle prétendait avoir résolu l’énorme défi de “simuler la matière à l’échelle quantique avec l’IA”. Maintenant, près de huit mois plus tard, un groupe de chercheurs universitaires de Russie et de Corée du Sud a peut-être découvert un problème avec la recherche originale qui met en doute toute la conclusion de l’article.

    Les implications pour cette recherche de pointe pourraient être énormes, si les conclusions de l’article sont vraies. Essentiellement, nous parlons de la possibilité d’utiliser l’intelligence artificielle découvrir de nouvelles façons de manipuler les éléments constitutifs de la matière.

    Un nouvel espoir

    Salutations, humanoïdes

    Abonnez-vous à notre newsletter maintenant pour un récapitulatif hebdomadaire de nos histoires préférées sur l’IA dans votre boîte de réception.

    La grande idée ici consiste à pouvoir simuler des interactions quantiques. Notre monde est composé de matière composée de molécules composées d’atomes. A chaque niveau d’abstraction, il devient de plus en plus difficile à simuler.

    Au moment où vous atteignez le niveau quantique, qui existe à l’intérieur des atomes, le problème de la simulation des interactions potentielles devient incroyablement difficile.

    Par un article de blog de DeepMind :

    Pour ce faire sur un ordinateur, il faut simuler des électrons, les particules subatomiques qui régissent la façon dont les atomes se lient pour former des molécules et sont également responsables du flux d’électricité dans les solides.

    Malgré des décennies d’efforts et plusieurs avancées significatives, la modélisation précise du comportement mécanique quantique des électrons reste un défi ouvert.

    Le problème fondamental est qu’il est vraiment difficile de prédire les probabilités qu’un électron donné se retrouve dans une position spécifique. Et la complexité augmente au fur et à mesure que vous en ajoutez.

    Comme DeepMind l’a souligné dans le même article de blog, deux physiciens des années 1960 ont fait une percée :

    Pierre Hohenberg et Walter Kohn ont réalisé qu’il n’est pas nécessaire de suivre chaque électron individuellement. Au lieu de cela, connaître la probabilité qu’un électron se trouve à chaque position (c’est-à-dire la densité d’électrons) est suffisant pour calculer exactement toutes les interactions. Kohn a reçu un prix Nobel de chimie après avoir prouvé cela, fondant ainsi la théorie fonctionnelle de la densité (DFT).

    Malheureusement, DFT n’a pu que simplifier le processus jusqu’à présent. La partie “fonctionnelle” de la théorie reposait sur les humains pour faire tout le gros du travail.

    Tout a changé en décembre lorsque DeepMind a publié un document intitulé “Repousser les frontières des fonctionnelles de densité en résolvant le problème de l’électron fractionnaire”.

    Dans cet article, l’équipe DeepMind affirme avoir radicalement amélioré les méthodes actuelles de modélisation du comportement quantique grâce au développement d’un réseau de neurones :

    En exprimant la fonctionnelle comme un réseau de neurones et en incorporant ces propriétés exactes dans les données de formation, nous apprenons des fonctionnelles exemptes d’erreurs systématiques importantes, ce qui se traduit par une meilleure description d’une large classe de réactions chimiques.

    Les universitaires contre-attaquent

    L’article de DeepMind a passé le processus d’examen initial et formel et tout s’est bien passé. Jusqu’en août 2022, une équipe de huit universitaires de Russie et de Corée du Sud a publié un commentaire remettre en cause sa conclusion.

    Par un communiqué de presse de l’Institut des sciences et technologies de Skolkovo :

    La capacité de DeepMind AI à généraliser le comportement de tels systèmes ne découle pas des résultats publiés et nécessite d’être revisitée.

    En d’autres termes : les universitaires contestent la manière dont l’IA de DeepMind est parvenue à ses conclusions.

    Selon les chercheurs commentateurs, le processus de formation utilisé par DeepMind pour construire son réseau de neurones lui a appris à mémoriser les réponses aux problèmes spécifiques auxquels il allait être confronté lors de l’analyse comparative – le processus par lequel les scientifiques déterminent si une approche est meilleure qu’une autre.

    Dans leur commentaire, les chercheurs écrivent :

    Bien que la conclusion de Kirkpatrick et al. sur le rôle des systèmes FC/FS dans l’ensemble de formation peut être correct, ce n’est pas la seule explication possible de leurs observations.

    À notre avis, les améliorations des performances de DM21 sur l’ensemble de données de test BBB par rapport à DM21m peuvent être causées par une raison beaucoup plus prosaïque : un chevauchement involontaire entre les ensembles de données d’apprentissage et de test.

    Si cela est vrai, cela signifierait que DeepMind n’a pas réellement appris à un réseau de neurones à prédire la mécanique quantique.

    Le retour de l’IA

    DeepMind n’a pas tardé à répondre. La société a publié sa réponse le même jour que le commentaire et a fourni une réprimande immédiate et ferme :

    Nous ne sommes pas d’accord avec leur analyse et pensons que les points soulevés sont soit incorrects, soit non pertinents par rapport aux principales conclusions de l’article et à l’évaluation de la qualité générale du DM21.

    L’équipe développe cela tout au long de sa réplique:

    DM21 ne mémorise pas les données ; ceci est simplement illustré par le fait que le DM21 Exc change sur toute la gamme de distances considérées dans BBB et n’est pas égal à la limite de séparation infinie, comme indiqué sur la Fig. 1, A et B, pour H2+ et H2. Par exemple, à 6 Å, le DM21 Exc est à ~13 kcal/mol de la limite infinie dans H2+ et H2 (bien que dans des directions opposées).

    Et, bien qu’il soit hors de la portée de cet article d’expliquer le jargon ci-dessus, nous pouvons supposer en toute sécurité que DeepMind était probablement préparé à cette objection particulière.

    Reste à savoir si cela résout le problème. À ce stade, nous n’avons pas encore vu de réfutation de la part de l’équipe académique pour voir si leurs inquiétudes ont été apaisées.

    En attendant, il est possible que les ramifications de cette discussion aillent bien au-delà de la simple incidence d’un seul document de recherche.

    Alors que les domaines de l’intelligence artificielle et de la science quantique deviennent de plus en plus étroitement liés, ils sont également de plus en plus dominés par des réservoirs de recherche d’entreprise aux poches profondes.

    Que se passe-t-il lorsqu’il y a une impasse scientifique – les parties adverses ne parviennent pas à s’entendre sur l’efficacité d’une approche technologique donnée via la méthode scientifique – et que les intérêts des entreprises entrent en jeu ?

    Et maintenant?

    Le cœur du problème pourrait résider dans l’incapacité d’expliquer comment les modèles d’IA “calculent les chiffres” pour arriver aux conclusions qu’ils font.

    Ces systèmes peuvent passer par des millions de permutations avant de produire une réponse. Il serait impossible d’expliquer chaque étape du processus, c’est exactement pourquoi nous avons besoin de raccourcis algorithmiques et d’IA pour forcer brutalement des problèmes à grande échelle qui seraient trop importants pour être résolus de front par un humain ou un ordinateur.

    À terme, à mesure que les systèmes d’IA continueront à évoluer, nous pourrions atteindre un point où nous n’aurions plus les outils nécessaires pour comprendre leur fonctionnement. Lorsque cela se produit, nous pouvons constater une divergence entre la technologie d’entreprise et celle qui passe l’examen externe par les pairs.

    Cela ne veut pas dire que l’article de DeepMind en est un exemple. Comme l’a écrit l’équipe académique commentatrice dans son communiqué de presse :

    L’utilisation de systèmes à électrons fractionnaires dans l’ensemble d’apprentissage n’est pas la seule nouveauté dans les travaux de DeepMind. Leur idée d’introduire les contraintes physiques dans un réseau neuronal via l’ensemble d’entraînement, ainsi que l’approche pour imposer le sens physique par l’entraînement sur le potentiel chimique correct, sont susceptibles d’être largement utilisées dans la construction des fonctionnelles DFT du réseau neuronal à l’avenir.

    Mais nous vivons un nouveau paradigme technologique audacieux, alimenté par l’IA. Il est probablement temps que nous commencions à réfléchir à ce à quoi ressemblera l’avenir dans un monde post-examen par les pairs.

    Source

    N'oubliez pas de voter pour cet article !
    1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
    Loading...

    La Rédaction

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.