Un nouvel algorithme d’apprentissage automatique formé uniquement avec des données réelles a classé plus de 2300 supernovae avec une précision de plus de 80% –

L’intelligence artificielle classe de véritables explosions de supernova sans l’utilisation traditionnelle des spectres, grâce à une équipe d’astronomes du Centre d’astrophysique | Harvard et Smithsonian. Les ensembles de données complets et les classifications résultantes sont accessibles au public pour une utilisation libre.
En entraînant un modèle d’apprentissage automatique à catégoriser les supernovae en fonction de leurs caractéristiques visibles, les astronomes ont pu classer des données réelles du Pan-STARRS1 Medium Deep Survey pour 2315 supernovae avec un taux de précision de 82% sans l’utilisation de spectres.
Les astronomes ont développé un logiciel qui classe différents types de supernovae en fonction de leurs courbes de lumière ou de la façon dont leur luminosité change au fil du temps. «Nous avons environ 2 500 supernovae avec des courbes de lumière du Pan-STARRS1 Medium Deep Survey, et parmi celles-ci, 500 supernovae avec des spectres pouvant être utilisés pour la classification», a déclaré Griffin Hosseinzadeh, chercheur postdoctoral au CfA et auteur principal du premier de deux articles publiés dans Le journal astrophysique. “Nous avons formé le classificateur en utilisant ces 500 supernovae pour classer les supernovae restantes là où nous n’avons pas pu observer le spectre.”
Edo Berger, astronome au CfA a expliqué qu’en demandant à l’intelligence artificielle de répondre à des questions spécifiques, les résultats deviennent de plus en plus précis. «L’apprentissage automatique recherche une corrélation avec les 500 étiquettes spectroscopiques originales. Nous lui demandons de comparer les supernovae dans différentes catégories: couleur, taux d’évolution ou luminosité. 80 et 90 pour cent. “
Bien que ce ne soit pas le premier projet d’apprentissage automatique pour la classification des supernovae, c’est la première fois que les astronomes ont accès à un ensemble de données réel suffisamment grand pour former un classificateur de supernovae basé sur l’intelligence artificielle, permettant de créer des algorithmes d’apprentissage automatique sans le utilisation de simulations.
“Si vous faites une courbe de lumière simulée, cela signifie que vous faites une hypothèse sur ce à quoi ressembleront les supernovae, et votre classificateur apprendra alors ces hypothèses également”, a déclaré Hosseinzadeh. “La nature posera toujours des complications supplémentaires que vous n’avez pas prises en compte, ce qui signifie que votre classificateur ne fonctionnera pas aussi bien sur des données réelles que sur des données simulées. Parce que nous avons utilisé des données réelles pour former nos classificateurs, cela signifie notre précision mesurée. est probablement plus représentatif de la façon dont nos classificateurs fonctionneront sur d’autres enquêtes. ” Au fur et à mesure que le classificateur catégorise les supernovae, a déclaré Berger, “Nous serons en mesure de les étudier à la fois rétrospectivement et en temps réel pour sélectionner les événements les plus intéressants pour un suivi détaillé. Nous utiliserons l’algorithme pour nous aider à choisir les aiguilles. et aussi pour regarder la meule de foin. “
Le projet a des implications non seulement pour les données d’archives, mais aussi pour les données qui seront collectées par les futurs télescopes. L’observatoire Vera C. Rubin devrait être mis en ligne en 2023 et conduira à la découverte de millions de nouvelles supernovae chaque année. Cela présente à la fois des opportunités et des défis pour les astrophysiciens, où le temps limité du télescope conduit à des classifications spectrales limitées.
“Lorsque l’Observatoire Rubin sera mis en ligne, il multipliera par 100 notre taux de découverte de supernovae, mais nos ressources spectroscopiques n’augmenteront pas”, a déclaré Ashley Villar, Simons Junior Fellow à l’Université Columbia et auteur principal du deuxième des deux articles. , ajoutant que si environ 10 000 supernovae sont actuellement découvertes chaque année, les scientifiques ne prennent des spectres qu’environ 10% de ces objets. “Si cela est vrai, cela signifie que seulement 0,1% des supernovae découvertes par l’Observatoire Rubin chaque année recevront une étiquette spectroscopique. Les 99,9% restants des données seront inutilisables sans méthodes comme la nôtre.”
Contrairement aux efforts passés, où les ensembles de données et les classifications n’étaient disponibles que pour un nombre limité d’astronomes, les ensembles de données du nouvel algorithme d’apprentissage automatique seront rendus publics. Les astronomes ont créé un logiciel facile à utiliser et accessible, et ont également publié toutes les données de Pan-STARRS1 Medium Deep Survey ainsi que les nouvelles classifications à utiliser dans d’autres projets. Hosseinzadeh a déclaré: “Il était vraiment important pour nous que ces projets soient utiles à toute la communauté de supernova, pas seulement à notre groupe. Il y a tellement de projets qui peuvent être réalisés avec ces données que nous ne pourrions jamais tous les faire nous-mêmes.” Berger a ajouté: “Ces projets sont des données ouvertes pour la science ouverte.”
Ce projet a été financé en partie par une subvention de la National Science Foundation (NSF) et de la Harvard Data Science Initiative (HDSI).