Des chercheurs permettent à l’IA d’utiliser son « imagination » – plus proche de la compréhension du monde par les humains

AI System Takes Inspiration From Humans
Le système d'IA s'inspire des humains

Le nouveau système d’IA s’inspire des humains : lorsqu’un humain voit une couleur d’un objet, nous pouvons facilement l’appliquer à n’importe quel autre objet en remplaçant la couleur d’origine par la nouvelle. Crédit : Chris Kim

Une équipe de chercheurs de USC aide l’IA à imaginer l’invisible, une technique qui pourrait également conduire à une IA plus juste, à de nouveaux médicaments et à une sécurité accrue des véhicules autonomes.

Imaginez un chat orange. Maintenant, imaginez le même chat, mais avec une fourrure noir charbon. Maintenant, imaginez le chat se pavanant le long de la Grande Muraille de Chine. Ce faisant, une série rapide d’activations de neurones dans votre cerveau produira des variations de l’image présentée, en fonction de votre connaissance antérieure du monde.

En d’autres termes, en tant qu’êtres humains, il est facile d’imaginer un objet avec des attributs différents. Mais, malgré les progrès des réseaux de neurones profonds qui égalent ou dépassent les performances humaines dans certaines tâches, les ordinateurs luttent toujours avec la compétence très humaine de « l’imagination ».

Aujourd’hui, une équipe de recherche de l’USC composée du professeur d’informatique Laurent Itti et des doctorants Yunhao Ge, Sami Abu-El-Haija et Gan Xin, a développé une IA qui utilise des capacités humaines pour imaginer un objet jamais vu auparavant avec différents les attributs. Le papier, intitulé Synthèse Zero-Shot avec apprentissage supervisé par le groupe, a été publié lors de la Conférence internationale 2021 sur les représentations de l’apprentissage le 7 mai.

“Nous nous sommes inspirés des capacités de généralisation visuelle humaine pour essayer de simuler l’imagination humaine dans des machines”, a déclaré Ge, auteur principal de l’étude.

« Les humains peuvent séparer leurs connaissances acquises par des attributs – par exemple, la forme, la pose, la position, la couleur – puis les recombiner pour imaginer un nouvel objet. Notre article tente de simuler ce processus à l’aide de réseaux de neurones.

Problème de généralisation de l’IA

Par exemple, supposons que vous souhaitiez créer un système d’IA qui génère des images de voitures. Idéalement, vous fourniriez à l’algorithme quelques images d’une voiture, et il serait capable de générer de nombreux types de voitures, des Porsche aux Pontiac en passant par les camionnettes, dans n’importe quelle couleur, sous plusieurs angles.

C’est l’un des objectifs longtemps recherchés de l’IA : créer des modèles pouvant extrapoler. Cela signifie qu’à partir de quelques exemples, le modèle devrait être capable d’extraire les règles sous-jacentes et de les appliquer à une vaste gamme de nouveaux exemples qu’il n’a jamais vus auparavant. Mais les machines sont le plus souvent entraînées sur des exemples de caractéristiques, des pixels par exemple, sans prendre en compte les attributs de l’objet.

La science de l’imaginaire

Dans cette nouvelle étude, les chercheurs tentent de surmonter cette limitation en utilisant un concept appelé désenchevêtrement. Le démêlage peut être utilisé pour générer des deepfakes, par exemple, en démêlant les mouvements et l’identité du visage humain. En faisant cela, a déclaré Ge, “les gens peuvent synthétiser de nouvelles images et vidéos qui remplacent l’identité de la personne d’origine par une autre personne, mais conservent le mouvement d’origine”.

De même, la nouvelle approche prend un groupe d’échantillons d’images – plutôt qu’un échantillon à la fois comme l’ont fait les algorithmes traditionnels – et exploite la similitude entre eux pour obtenir ce qu’on appelle “l’apprentissage de la représentation démêlée contrôlable”.

Ensuite, il recombine ces connaissances pour obtenir une « synthèse d’images nouvelle contrôlable », ou ce que vous pourriez appeler l’imagination. “Par exemple, prenez le film Transformer comme exemple”, a déclaré Ge, “Il peut prendre la forme d’une voiture Megatron, la couleur et la pose d’une voiture Bumblebee jaune et l’arrière-plan de Times Square à New York. Le résultat sera une voiture Megatron de couleur Bumblebee roulant à Times Square, même si cet échantillon n’a pas été vu pendant la session de formation.

C’est similaire à la façon dont nous, humains, extrapolons : lorsqu’un humain voit une couleur d’un objet, nous pouvons facilement l’appliquer à n’importe quel autre objet en remplaçant la couleur d’origine par la nouvelle. En utilisant leur technique, le groupe a généré un nouvel ensemble de données contenant 1,56 million d’images qui pourraient aider les futures recherches dans le domaine.

Comprendre le monde

Bien que le démêlage ne soit pas une idée nouvelle, les chercheurs affirment que leur cadre peut être compatible avec presque tous les types de données ou de connaissances. Cela élargit les possibilités de candidatures. Par exemple, démêler les connaissances liées à la race et au genre pour rendre l’IA plus juste en supprimant complètement les attributs sensibles de l’équation.

Dans le domaine de la médecine, cela pourrait aider les médecins et les biologistes à découvrir des médicaments plus utiles en séparant la fonction du médicament d’autres propriétés, puis en les recombinant pour synthétiser un nouveau médicament. Imprégner les machines d’imagination pourrait également aider à créer une IA plus sûre en permettant, par exemple, aux véhicules autonomes d’imaginer et d’éviter des scénarios dangereux auparavant inédits lors de la formation.

« L’apprentissage en profondeur a déjà démontré des performances et des promesses inégalées dans de nombreux domaines, mais trop souvent, cela s’est produit par le biais d’un mimétisme superficiel et sans une compréhension plus approfondie des attributs distincts qui rendent chaque objet unique », a déclaré Itti. “Cette nouvelle approche de désenchevêtrement, pour la première fois, libère véritablement un nouveau sens de l’imagination dans les systèmes d’IA, les rapprochant de la compréhension du monde par les humains.”

Référence : « Zero-shot Synthesis with Group-Supervised Learning » par Yunhao Ge, Sami Abu-El-Haija, Gan Xin et Laurent Itti, 7 mai 2021, Conférence internationale 2021 sur les représentations de l’apprentissage.
Relier

Related Posts