Une preuve révolutionnaire ouvre la voie à l’IA quantique – Surmonter la menace des « plateaux stériles »

Avatar photo
Breakthrough Proof Quantum AI
L'IA quantique à la preuve de la percée

Une nouvelle preuve que certains réseaux convolutifs quantiques peuvent être assurés d’être entraînés ouvre la voie à l’intelligence artificielle quantique pour aider à la découverte de matériaux et à de nombreuses autres applications. Crédit : LANL

Un nouveau théorème démontre que les réseaux de neurones convolutifs peuvent toujours être entraînés sur des ordinateurs quantiques, surmontant la menace des « plateaux stériles » dans les problèmes d’optimisation.

Les réseaux de neurones convolutifs fonctionnant sur des ordinateurs quantiques ont généré un buzz important pour leur potentiel à analyser les données quantiques mieux que les ordinateurs classiques. Alors qu’un problème de résolution fondamental connu sous le nom de « plateaux stériles » a limité l’application de ces réseaux de neurones pour de grands ensembles de données, de nouvelles recherches surmontent ce talon d’Achille avec une preuve rigoureuse qui garantit l’évolutivité.

“La façon dont vous construisez un réseau de neurones quantiques peut conduire à un plateau stérile, ou non”, a déclaré Marco Cerezo, coauteur de l’article intitulé “Absence of Barren Plateaus in Quantum Convolutional Neural Networks”, publié récemment par une équipe du Laboratoire national de Los Alamos. dans Examen physique X. Cerezo est un physicien spécialisé dans l’informatique quantique, l’apprentissage automatique quantique et l’information quantique à Los Alamos. « Nous avons prouvé l’absence de plateaux stériles pour un type particulier de réseau de neurones quantiques. Notre travail fournit des garanties d’entraînement pour cette architecture, ce qui signifie que l’on peut entraîner de manière générique ses paramètres.

En tant que méthodologie d’intelligence artificielle (IA), les réseaux de neurones à convolution quantique s’inspirent du cortex visuel. En tant que tels, ils impliquent une série de couches convolutives, ou filtres, entrelacées avec des couches de mise en commun qui réduisent la dimension des données tout en conservant les caractéristiques importantes d’un ensemble de données.

Ces réseaux de neurones peuvent être utilisés pour résoudre une gamme de problèmes, de la reconnaissance d’images à la découverte de matériaux. Surmonter les plateaux arides est essentiel pour extraire tout le potentiel des ordinateurs quantiques dans les applications d’IA et démontrer leur supériorité sur les ordinateurs classiques.

Jusqu’à présent, a déclaré Cerezo, les chercheurs en apprentissage automatique quantique ont analysé comment atténuer les effets des plateaux arides, mais il leur manquait une base théorique pour l’éviter complètement. Les travaux de Los Alamos montrent comment certains réseaux de neurones quantiques sont, en fait, immunisés contre les plateaux arides.

“Avec cette garantie en main, les chercheurs pourront désormais passer au crible les données des ordinateurs quantiques sur les systèmes quantiques et utiliser ces informations pour étudier les propriétés des matériaux ou découvrir de nouveaux matériaux, entre autres applications”, a déclaré Patrick Coles, physicien quantique à Los Alamos. et co-auteur de l’article.

De nombreuses autres applications pour les algorithmes d’IA quantique verront le jour, pense Coles, alors que les chercheurs utilisent plus fréquemment des ordinateurs quantiques à court terme et génèrent de plus en plus de données – tous les programmes d’apprentissage automatique sont gourmands en données.

Éviter le gradient de fuite

“Tout espoir d’accélération ou d’avantage quantique est perdu si vous avez un plateau stérile”, a déclaré Cerezo.

Le nœud du problème est un « gradient de disparition » dans le paysage de l’optimisation. Le paysage est composé de collines et de vallées, et le but est d’entraîner les paramètres du modèle pour trouver la solution en explorant la géographie du paysage. La solution se trouve généralement au fond de la vallée la plus basse, pour ainsi dire. Mais dans un paysage plat, on ne peut pas entraîner les paramètres car il est difficile de déterminer la direction à prendre.

Ce problème devient particulièrement pertinent lorsque le nombre de caractéristiques de données augmente. En fait, le paysage devient exponentiellement plat avec la taille de l’entité. Par conséquent, en présence d’un plateau stérile, le réseau de neurones quantiques ne peut pas être agrandi.

L’équipe de Los Alamos a développé une nouvelle approche graphique pour analyser la mise à l’échelle au sein d’un réseau de neurones quantiques et prouver sa capacité d’entraînement.

Pendant plus de 40 ans, les physiciens ont pensé que les ordinateurs quantiques seraient utiles pour simuler et comprendre les systèmes quantiques de particules, qui étouffent les ordinateurs classiques classiques. Le type de réseau de neurones à convolution quantique que la recherche de Los Alamos a prouvé robuste devrait avoir des applications utiles dans l’analyse des données de simulations quantiques.

“Le domaine de l’apprentissage automatique quantique est encore jeune”, a déclaré Coles. « Il y a une citation célèbre sur les lasers, quand ils ont été découverts pour la première fois, qui disait qu’ils étaient une solution à la recherche d’un problème. Maintenant, les lasers sont utilisés partout. De même, un certain nombre d’entre nous soupçonnent que les données quantiques deviendront hautement disponibles, puis l’apprentissage automatique quantique prendra son envol. »

Par exemple, la recherche se concentre sur les matériaux céramiques en tant que supraconducteurs à haute température, a déclaré Coles, qui pourraient améliorer le transport sans friction, comme les trains à lévitation magnétique. Mais analyser les données sur le grand nombre de phases du matériau, qui sont influencées par la température, la pression et les impuretés dans ces matériaux, et classer les phases est une tâche énorme qui dépasse les capacités des ordinateurs classiques.

À l’aide d’un réseau de neurones quantiques évolutif, un ordinateur quantique pourrait passer au crible un vaste ensemble de données sur les différents états d’un matériau donné et corréler ces états avec des phases pour identifier l’état optimal pour la supraconductivité à haute température.

Référence : « Absence of Barren Plateaus in Quantum Convolutional Neural Networks » par Arthur Pesah, M. Cerezo, Samson Wang, Tyler Volkoff, Andrew T. Sornborger et Patrick J. Coles, 15 octobre 2021, Examen physique X.
DOI : 10.1103 / PhysRevX.11.041011

Financement : Programme de recherche et développement dirigé par un laboratoire au Laboratoire national de Los Alamos.

Related Posts