L’IA utilisée pour prédire la synthèse de nouveaux matériaux complexes – « Matériaux qu’aucun chimiste ne pourrait prédire »

Avatar photo
Machine Learning Libraries
Bibliothèques d'apprentissage automatique

L’apprentissage automatique permet la découverte de matériaux. Crédit : Université Northwestern

L’apprentissage automatique par IA présente une feuille de route pour définir de nouveaux matériaux pour tous les besoins, avec des implications en matière d’énergie verte et de réduction des déchets.

Les scientifiques et les institutions consacrent chaque année plus de ressources à la découverte de nouveaux matériaux pour alimenter le monde. Alors que les ressources naturelles diminuent et que la demande de produits à plus haute valeur ajoutée et à performances avancées augmente, les chercheurs se tournent de plus en plus vers les nanomatériaux.

Les nanoparticules ont déjà trouvé leur place dans des applications allant du stockage et de la conversion d’énergie à l’informatique quantique et thérapeutiques. Mais étant donné la vaste accordabilité compositionnelle et structurelle que permet la nanochimie, des approches expérimentales en série pour identifier de nouveaux matériaux imposent des limites insurmontables à la découverte.

Désormais, les chercheurs de Université du nord-ouest et le Toyota Research Institute (TRI) ont appliqué avec succès l’apprentissage automatique pour guider la synthèse de nouveaux nanomatériaux, éliminant ainsi les obstacles associés à la découverte de matériaux. L’algorithme hautement qualifié a passé au peigne fin un ensemble de données défini pour prédire avec précision de nouvelles structures qui pourraient alimenter les processus dans les industries de l’énergie propre, de la chimie et de l’automobile.

« Nous avons demandé au modèle de nous dire quels mélanges de jusqu’à sept éléments feraient quelque chose qui n’a jamais été fait auparavant », a déclaré Chad Mirkin, un expert en nanotechnologie de Northwestern et l’auteur correspondant de l’article. “La machine a prédit 19 possibilités, et, après avoir testé chacune expérimentalement, nous avons trouvé que 18 des prédictions étaient correctes.”

L’étude, « Machine learning-accelerated design and lysis of polyelemental heterostructures », sera publiée le 22 décembre dans la revue Avancées scientifiques.

Mirkin est professeur de chimie George B. Rathmann au Weinberg College of Arts and Sciences; professeur de génie chimique et biologique, de génie biomédical et de science et génie des matériaux à la McCormick School of Engineering; et professeur de médecine à la Feinberg School of Medicine. Il est également le directeur fondateur de l’Institut international de nanotechnologie.

Cartographier le génome des matériaux

Selon Mirkin, ce qui rend cela si important, c’est l’accès à des ensembles de données d’une qualité sans précédent, car les modèles d’apprentissage automatique et les algorithmes d’IA ne peuvent être aussi bons que les données utilisées pour les former.

L’outil de génération de données, appelé « Megalibrary », a été inventé par Mirkin et élargit considérablement le champ de vision d’un chercheur. Chaque mégabibliothèque abrite des millions, voire des milliards de nanostructures, chacune avec une forme, une structure et une composition légèrement distinctes, toutes codées en position sur une puce de deux centimètre carré. À ce jour, chaque puce contient plus de nouveaux matériaux inorganiques que n’en ont jamais été collectés et classés par les scientifiques.

L’équipe de Mirkin a développé les mégabibliothèques en utilisant une technique (également inventée par Mirkin) appelée lithographie au stylo polymère, un outil de nanolithographie massivement parallèle qui permet le dépôt spécifique à un site de centaines de milliers de caractéristiques chaque seconde.

Lors de la cartographie du génome humain, les scientifiques ont été chargés d’identifier des combinaisons de quatre bases. Mais le « génome des matériaux » vaguement synonyme comprend des combinaisons de nanoparticules de l’un des 118 éléments utilisables du tableau périodique, ainsi que des paramètres de forme, de taille, de morphologie de phase, de structure cristalline, etc. Construire de plus petits sous-ensembles de nanoparticules sous la forme de mégabibliothèques rapprochera les chercheurs de la réalisation d’une carte complète du génome d’un matériau.

Mirkin a déclaré que même avec quelque chose de similaire à un « génome » de matériaux, identifier comment les utiliser ou les étiqueter nécessite des outils différents.

“Même si nous pouvons fabriquer des matériaux plus rapidement que quiconque sur terre, cela reste une goutte d’eau dans l’océan des possibilités”, a déclaré Mirkin. « Nous voulons définir et exploiter le génome des matériaux, et nous le faisons grâce à l’intelligence artificielle. »

Les applications d’apprentissage automatique sont parfaitement adaptées pour s’attaquer à la complexité de la définition et de l’exploration du génome des matériaux, mais sont limitées par la possibilité de créer des ensembles de données pour former des algorithmes dans l’espace. Mirkin a déclaré que la combinaison des mégabibliothèques avec l’apprentissage automatique pourrait enfin éradiquer ce problème, ce qui permettrait de comprendre quels paramètres déterminent certaines propriétés des matériaux.

« Des matériaux qu’aucun chimiste ne pouvait prédire »

Si les mégabibliothèques fournissent une carte, l’apprentissage automatique fournit la légende.

L’utilisation de Megalibraries comme source de données sur les matériaux de haute qualité et à grande échelle pour la formation d’algorithmes d’intelligence artificielle (IA), permet aux chercheurs de s’éloigner de «l’intuition chimique aiguë» et de l’expérimentation en série accompagnant généralement le processus de découverte de matériaux, selon Mirkin.

“Northwestern avait les capacités de synthèse et les capacités de caractérisation de pointe pour déterminer les structures des matériaux que nous générons”, a déclaré Mirkin. « Nous avons travaillé avec l’équipe d’IA de TRI pour créer des entrées de données pour les algorithmes d’IA qui ont finalement fait ces prédictions sur des matériaux qu’aucun chimiste ne pouvait prédire. »

Dans l’étude, l’équipe a compilé des données structurelles de Megalibrary précédemment générées, constituées de nanoparticules avec des compositions, des structures, des tailles et des morphologies complexes. Ils ont utilisé ces données pour entraîner le modèle et lui ont demandé de prédire les compositions de quatre, cinq et six éléments qui aboutiraient à une certaine caractéristique structurelle. Dans 19 prédictions, le modèle d’apprentissage automatique a prédit correctement les nouveaux matériaux 18 fois, soit environ 95 % précision taux.

Avec peu de connaissances en chimie ou en physique, en utilisant uniquement les données d’entraînement, le modèle était capable de prédire avec précision des structures complexes qui n’ont jamais existé sur terre.

“Comme ces données le suggèrent, l’application de l’apprentissage automatique, combinée à la technologie Megalibrary, peut être la voie à suivre pour enfin définir le génome des matériaux”, a déclaré Joseph Montoya, chercheur principal au TRI.

Les nanoparticules métalliques sont prometteuses pour catalyser des réactions critiques sur le plan industriel telles que le dégagement d’hydrogène, le dioxyde de carbone (CO2) réduction et réduction et dégagement d’oxygène. Le modèle a été formé sur un grand ensemble de données construit par le nord-ouest pour rechercher des nanoparticules multimétalliques avec des paramètres définis autour de la phase, de la taille, de la dimension et d’autres caractéristiques structurelles qui modifient les propriétés et la fonction des nanoparticules.

La technologie Megalibrary peut également conduire à des découvertes dans de nombreux domaines essentiels pour l’avenir, notamment le recyclage du plastique, les cellules solaires, les supraconducteurs et les qubits.

Un outil qui fonctionne mieux dans le temps

Avant l’avènement des mégabibliothèques, les outils d’apprentissage automatique étaient formés sur des ensembles de données incomplets collectés par différentes personnes à des moments différents, limitant leur pouvoir de prédiction et leur généralisabilité. Les mégabibliothèques permettent aux outils d’apprentissage automatique de faire ce qu’ils font le mieux : apprendre et devenir plus intelligent au fil du temps. Mirkin a déclaré que leur modèle ne ferait que mieux prédire les matériaux corrects car il est alimenté par davantage de données de haute qualité collectées dans des conditions contrôlées.

“Créer cette capacité d’IA, c’est pouvoir prédire les matériaux requis pour toute application”, a déclaré Montoya. « Plus nous avons de données, plus nous avons de capacités prédictives. Lorsque vous commencez à former l’IA, vous commencez par la localiser sur un ensemble de données et, au fur et à mesure qu’elle apprend, vous continuez à ajouter de plus en plus de données – c’est comme prendre un enfant et passer de la maternelle à son doctorat. L’expérience et les connaissances combinées dictent en fin de compte jusqu’où ils peuvent aller.

L’équipe utilise maintenant cette approche pour trouver des catalyseurs essentiels aux processus d’alimentation dans les industries de l’énergie propre, de l’automobile et de la chimie. L’identification de nouveaux catalyseurs verts permettra la conversion de déchets et de matières premières abondantes en matière utile, la production d’hydrogène, l’utilisation du dioxyde de carbone et le développement de piles à combustible. La production de catalyseurs pourrait également être utilisée pour remplacer des matériaux coûteux et rares comme l’iridium, le métal utilisé pour générer de l’hydrogène vert et du CO2 produits de réduction.

Référence : « Machine learning-accelerated design and lysis of polyelemental heterostructures » 22 décembre 2021, Avancées scientifiques.
DOI : 10.1126/sciadv.abj5505

La recherche a été financée par le TRI. Un soutien supplémentaire est venu de la Fondation Sherman Fairchild, Inc., et du Bureau de la recherche scientifique de l’Air Force (numéros de récompense FA9550-16-1-0150 et FA9550-18-1-0493). Les co-auteurs de Northwestern sont Carolin B. Wahl, doctorante en science des matériaux et ingénierie, et Jordan H. Swisher, doctorant en chimie, tous deux membres du laboratoire Mirkin. Les auteurs du TRI incluent Muratahan Aykol et Montoya.

Ce travail a fait usage de l’installation EPIC de la Northwestern University’s NUANCE Center, qui a reçu le soutien de Soft and Hybrid Nanotechnology Experimental (SHyNE) Resource (NSF ECCS-1542205); le programme MRSEC (NSF DMR-1720139) au Materials Research Center ; l’Institut international de nanotechnologie (IIN) ; la Fondation Keck ; et l’État de l’Illinois, par l’intermédiaire de l’IIN.

Related Posts