L’apprentissage automatique est un outil puissant lors de la recherche d’exoplanètes

Avatar photo

L’astronomie est entrée dans l’ère du big data, où les astronomes se retrouvent submergés d’informations grâce à des instruments de pointe et des techniques de partage de données. Des installations telles que l’observatoire Vera Rubin (VRO) collectent quotidiennement environ 20 téraoctets (To) de données. D’autres, comme le télescope de trente mètres (TMT), devraient collecter jusqu’à 90 To une fois opérationnels. En conséquence, les astronomes traitent de 100 à 200 pétaoctets de données chaque année, et l’astronomie devrait bientôt atteindre « l’ère des exaoctets ».

En réponse, les observatoires ont mis en place des solutions de crowdsourcing et rendu leurs données en libre accès afin que les scientifiques citoyens puissent participer au processus d’analyse qui prend du temps. De plus, les astronomes se tournent de plus en plus vers les algorithmes d’apprentissage automatique pour les aider à identifier les objets d’intérêt (OI) dans l’Univers. Dans une étude récente, une équipe dirigée par l’Université de Géorgie a révélé comment l’intelligence artificielle pouvait distinguer simultanément les faux positifs et les candidats exoplanètes, facilitant ainsi le travail des chasseurs d’exoplanètes.

L’étude a été dirigée par Jason Terry, doctorant au Center for Simulational Physics (CSP) de l’Université de Géorgie (UGA) et ancien chercheur au Los Alamos National Laboratory (LANL). Il a été rejoint par des chercheurs de l’Université de Californie à San Francisco (UCSF), du Cardiovascular Research Institute (CRI) et de l’Université de l’Alabama. L’article qui décrit leurs recherches, “Locating Hidden Exoplanets in ALMA Data Using Machine Learning”, est récemment paru dans Le Journal Astrophysique.

Projet de sous-structures de disque à haute résolution angulaire. 1 crédit

La première exoplanète confirmée a été découverte en 1992 et son nombre a augmenté de façon exponentielle au cours des quinze dernières années. À ce jour, 5250 exoplanètes ont été confirmées dans 3921 systèmes, tandis que 9208 autres candidats sont en attente de confirmation. Néanmoins, la grande majorité d’entre eux appartiennent à l’une des trois catégories suivantes : semblables à Neptune (1 825), géantes gazeuses (1 630) et super-terres (1 595). Ces planètes sont plus massives et orbitent généralement plus loin de leurs étoiles que les planètes rocheuses plus petites (ou « ressemblant à la Terre »), dont seulement 195 ont été trouvées.

Pendant ce temps, les exoplanètes qui sont au stade de la formation sont difficiles à voir pour deux raisons principales : premièrement, elles sont souvent à des centaines d’années-lumière de la Terre (trop loin pour être clairement visibles), et deuxièmement, les disques protoplanétaires à partir desquels elles se forment sont très épais. , mesurant jusqu’à 1 UA de diamètre (la distance entre la Terre et le Soleil). D’après ce que les astronomes ont vu, les planètes ont tendance à se former au milieu de ces disques et transmettent une signature de la poussière et des gaz soulevés au cours du processus. Mais comme Terry l’a dit dans un récent communiqué de presse de l’AGU, la recherche montre que l’intelligence artificielle peut aider les scientifiques à surmonter ces difficultés :

“L’une des nouveautés à ce sujet est l’analyse des environnements où les planètes sont encore en train de se former. L’apprentissage automatique a rarement été appliqué au type de données que nous utilisons auparavant, en particulier pour examiner des systèmes qui forment encore activement des planètes… Dans une large mesure, la façon dont nous analysons ces données est que vous avez des dizaines, des centaines d’images pour un spécifique disque et vous regardez simplement à travers et demandez ‘est-ce une agitation?’ puis lancez une douzaine de simulations pour voir si c’est un remue-ménage et… c’est facile de les ignorer – ils sont vraiment minuscules, et cela dépend du nettoyage, et donc cette méthode est une, très rapide, et deux, sa précision obtient des planètes qui les humains manqueraient.

Pour les besoins de leur étude, l’équipe a développé un modèle d’apprentissage automatique basé sur la vision par ordinateur (CV), un domaine de l’intelligence artificielle qui permet aux ordinateurs et aux systèmes d’extraire des données à partir d’images et de vidéos numériques. L’équipe a formé son modèle CV à l’aide d’images synthétiques qu’elle a générées, puis a appliqué le modèle à des observations réelles de disques protoplanétaires menées par l’Atacama Large Millimeter-submillimeter Array (ALMA). Au final, ils ont démontré que leur méthode d’apprentissage automatique (basée sur CV) pouvait identifier correctement la présence d’une ou plusieurs planètes dans des disques.

Atacama Large Millimeter/submillimeter Array (ALMA), situé au sommet du plateau de Chajnantor dans les Andes chiliennes. Crédit : ESO

Ils ont en outre démontré qu’il pouvait correctement contraindre l’emplacement des planètes dans ces disques. La co-auteure Cassandra Hall, professeure adjointe d’astrophysique et chercheuse principale du groupe de recherche sur la formation des exoplanètes et des planètes à l’UGA, a expliqué :

« Il s’agit d’une preuve de concept très excitante. La puissance ici est que nous avons utilisé exclusivement des données de télescope synthétiques générées par des simulations informatiques pour former cette IA, puis les avons appliquées à de vraies données de télescope. Cela n’a jamais été fait auparavant dans notre domaine et ouvre la voie à un déluge de découvertes à mesure que les données du télescope James Webb arrivent.

Dans les années à venir, plusieurs observatoires spatiaux et terrestres de nouvelle génération rejoindront le Télescope spatial James Webb (JWST). Cela inclut le Télescope spatial romain Nany Grace (RST), le télescope extrêmement grand (ELT), le télescope géant de Magellan (GMT) et le télescope de trente mètres (TMT). Le et d’autres télescopes recueilleront des niveaux sans précédent de données dans plusieurs longueurs d’onde, qui seront utilisées pour rechercher des exoplanètes. Plus que cela, les instruments de pointe qu’ils utiliseront pourront caractériser les atmosphères des exoplanètes comme jamais auparavant. Terry a dit :

Au-delà de la recherche sur les exoplanètes, ces observatoires enquêteront sur les mystères cosmologiques comme la matière noire, l’énergie noire et sonderont les premiers âges de l’Univers. Des outils analytiques de nouvelle génération sont également nécessaires pour analyser ces données de haute qualité afin que les astronomes puissent passer plus de temps à interpréter les données et à proposer de nouvelles théories pour les expliquer. Selon Terry, l’apprentissage automatique est déjà capable de répondre à cette demande, permettra d’économiser du temps et de l’argent et guidera efficacement le temps scientifique, les investissements et les nouvelles propositions :

“Il reste, au sein de la science et en particulier de l’astronomie en général, un scepticisme à l’égard de l’apprentissage automatique et de l’IA, une critique valable de ce qu’il s’agit de cette boîte noire – où vous avez des centaines de millions de paramètres et d’une manière ou d’une autre vous obtenez une réponse. Mais nous pensons avoir démontré assez fortement dans ce travail que l’apprentissage automatique est à la hauteur de la tâche. Vous pouvez discuter de l’interprétation. Mais dans ce cas, nous avons des résultats très concrets qui démontrent la puissance de cette méthode.

Lectures complémentaires : UGA aujourd’hui, Le Journal Astrophysique

Related Posts