Les techniques d’apprentissage en profondeur aident à visualiser les données de rayons X en trois dimensions –

Les ordinateurs sont capables de traiter rapidement des images 2D depuis un certain temps. Votre téléphone portable peut prendre des photos numériques et les manipuler de plusieurs manières. Cependant, il est beaucoup plus difficile de traiter une image en trois dimensions et de le faire dans les délais. Les mathématiques sont plus complexes et calculer ces nombres, même sur un superordinateur, prend du temps.
C’est le défi qu’un groupe de scientifiques du laboratoire national d’Argonne du département américain de l’Énergie (DOE) s’efforce de relever. L’intelligence artificielle s’est imposée comme une solution polyvalente aux problèmes posés par le traitement des mégadonnées. Pour les scientifiques qui utilisent l’Advanced Photon Source (APS), une installation utilisateur du DOE Office of Science à Argonne, pour traiter des images 3D, cela peut être la clé pour transformer les données de rayons X en formes visibles et compréhensibles à un rythme beaucoup plus rapide. Une percée dans ce domaine pourrait avoir des implications pour l’astronomie, la microscopie électronique et d’autres domaines scientifiques dépendant de grandes quantités de données 3D.
L’équipe de recherche, qui comprend des scientifiques de trois divisions d’Argonne, a développé un nouveau cadre de calcul appelé 3D-CDI-NN, et a montré qu’il peut créer des visualisations 3D à partir de données collectées à l’APS des centaines de fois plus rapidement que les méthodes traditionnelles. Les recherches de l’équipe ont été publiées dans Examens de physique appliquée, une publication de l’Institut américain de physique.
CDI signifie imagerie par diffraction cohérente, une technique de rayons X qui consiste à faire rebondir des faisceaux de rayons X ultra-lumineux sur des échantillons. Ces faisceaux de lumière seront ensuite collectés par des détecteurs en tant que données, et il faut un certain effort de calcul pour transformer ces données en images. Une partie du défi, explique Mathew Cherukara, chef du groupe Computational X-ray Science de la division X-ray Science (XSD) d’Argonne, est que les détecteurs ne capturent qu’une partie des informations des faisceaux.
Mais il y a des informations importantes contenues dans les données manquantes, et les scientifiques s’appuient sur des ordinateurs pour remplir ces informations. Comme le note Cherukara, bien que cela prenne un certain temps à faire en 2D, cela prend encore plus de temps à faire avec des images 3D. La solution est donc d’entraîner une intelligence artificielle à reconnaître les objets et les changements microscopiques qu’ils subissent directement à partir des données brutes, sans avoir à remplir les informations manquantes.
Pour ce faire, l’équipe a commencé avec des données de rayons X simulées pour entraîner le réseau de neurones. Le NN dans le titre du cadre, un réseau de neurones est une série d’algorithmes qui peuvent apprendre à un ordinateur à prédire les résultats en fonction des données qu’il reçoit. Henry Chan, l’auteur principal de l’article et chercheur postdoctoral au Center for Nanoscale Materials (CNM), une installation utilisateur du DOE Office of Science à Argonne, a dirigé cette partie du travail.
“Nous avons utilisé des simulations informatiques pour créer des cristaux de différentes formes et tailles, et nous les avons convertis en images et modèles de diffraction pour que le réseau de neurones puisse apprendre”, a déclaré Chan. “La facilité de générer rapidement de nombreux cristaux réalistes pour l’entraînement est l’avantage des simulations.”
Ce travail a été effectué à l’aide des ressources de l’unité de traitement graphique du Laboratoire commun d’évaluation des systèmes d’Argonne, qui déploie des bancs d’essai de pointe pour permettre la recherche sur les plates-formes et capacités de calcul haute performance émergentes.
Une fois le réseau formé, explique Stephan Hruszkewycz, physicien et chef de groupe à la division Science des matériaux d’Argonne, il peut se rapprocher assez rapidement de la bonne réponse. Cependant, il y a encore de la place pour le raffinement, de sorte que le cadre 3D-CDI-NN inclut un processus pour amener le réseau jusqu’au bout. Hruszkewycz, avec Saugat Kandel, étudiant diplômé de la Northwestern University, a travaillé sur cet aspect du projet, ce qui réduit le besoin d’étapes itératives fastidieuses.
“La Division des sciences des matériaux se soucie de la diffraction cohérente parce que vous pouvez voir des matériaux à des échelles de quelques nanomètres – environ 100 000 fois plus petites que la largeur d’un cheveu humain – avec des rayons X qui pénètrent dans les environnements”, a déclaré Hruszkewycz. “Cet article est une démonstration de ces méthodes avancées, et il facilite grandement le processus d’imagerie. Nous voulons savoir ce qu’est un matériau et comment il évolue au fil du temps, et cela nous aidera à en faire de meilleures images lors de nos mesures. “
Enfin, la capacité de 3D-CDI-NN à remplir les informations manquantes et à obtenir une visualisation 3D a été testée sur des données de rayons X réelles de minuscules particules d’or, collectées sur la ligne de lumière 34-ID-C de l’APS. Le résultat est une méthode de calcul qui est des centaines de fois plus rapide sur les données simulées, et presque aussi rapide sur les données APS réelles. Les tests ont également montré que le réseau peut reconstruire des images avec moins de données qu’il n’en faut habituellement pour compenser les informations non captées par les détecteurs.
La prochaine étape de cette recherche, selon Chan, consiste à intégrer le réseau dans le flux de travail de l’APS, afin qu’il apprenne des données au fur et à mesure qu’elles sont prises. Si le réseau apprend des données de la ligne de lumière, a-t-il déclaré, il s’améliorera continuellement.
Pour cette équipe, il y a aussi un élément temporel dans cette recherche. Comme Cherukara le souligne, une mise à niveau massive de l’APS est en cours, et la quantité de données générées maintenant augmentera de façon exponentielle une fois le projet terminé. L’APS amélioré générera des faisceaux de rayons X jusqu’à 500 fois plus brillants, et la cohérence du faisceau – la caractéristique de la lumière qui lui permet de diffracter d’une manière qui code plus d’informations sur l’échantillon – sera considérablement augmentée .
Cela signifie que même s’il faut maintenant deux à trois minutes pour rassembler des données d’imagerie de diffraction cohérentes à partir d’un échantillon et obtenir une image, la partie collecte de données de ce processus sera bientôt jusqu’à 500 fois plus rapide. Le processus de conversion de ces données en une image utilisable doit également être des centaines de fois plus rapide qu’il ne l’est actuellement.
“Afin de tirer pleinement parti de ce dont l’APS mis à niveau sera capable, nous devons réinventer l’analyse des données”, a déclaré Cherukara. “Nos méthodes actuelles ne suffisent pas pour suivre le rythme. L’apprentissage automatique peut être pleinement utilisé et aller au-delà de ce qui est actuellement possible.”
En plus de Chan, Cherukara et Hruszkewycz, les auteurs de l’article incluent Subramanian Sankaranarayanan et Ross Harder, tous deux d’Argonne; Youssef Nashed du Laboratoire national des accélérateurs SLAC ; et Saugat Kandel de l’Université Northwestern.