L’ingénierie basée sur la physique et le problème de la “boîte noire” de l’apprentissage automatique

Par

Concept de mystère de l'apprentissage automatique de l'IA

Sur MIT 2.C161, George Barbastathis montre comment les ingénieurs en mécanique peuvent utiliser leur connaissance des systèmes physiques pour contrôler les algorithmes et développer des prédictions plus précises.

Les algorithmes d’apprentissage automatique sont souvent considérés comme une “boîte noire”. Une fois que les données sont introduites dans un algorithme, on ne sait pas toujours exactement comment l’algorithme arrive à sa prédiction. Cela peut être particulièrement frustrant lorsque les choses tournent mal. Un nouveau cours d’ingénierie mécanique (MechE) au MIT enseigne aux étudiants comment s’attaquer au problème de la “boîte noire”, grâce à une combinaison de science des données et d’ingénierie basée sur la physique.

Dans le cours 2.C161 (Modélisation et conception de systèmes physiques à l’aide de l’apprentissage automatique), le professeur George Barbastathis montre comment les ingénieurs en mécanique peuvent utiliser leurs connaissances uniques des systèmes physiques pour contrôler les algorithmes et développer des prédictions plus précises.

“Je voulais suivre le cours 2.C161 parce que les modèles d’apprentissage automatique sont généralement une “boîte noire”, mais ce cours nous a appris à construire un modèle de système qui est informé par la physique afin que nous puissions jeter un coup d’œil à l’intérieur”, explique Crystal Owens, un étudiant diplômé en génie mécanique qui a suivi le cours au printemps 2021.

En tant que présidente du Comité sur l’intégration stratégique de la science des données dans le génie mécanique, Mme Barbastathis a eu de nombreuses conversations avec des étudiants en génie mécanique, des chercheurs et des professeurs pour mieux comprendre les défis et les succès qu’ils ont rencontrés en utilisant l’apprentissage automatique dans leur travail.

George Barbastathis

Le professeur George Barbastathis apprend aux étudiants en génie mécanique à utiliser leurs connaissances des systèmes physiques pour développer des modèles et des algorithmes d’apprentissage automatique plus précis. Crédit : Tony Pulsone

” Un commentaire que nous avons fréquemment entendu est que ces collègues peuvent voir la valeur des méthodes de science des données pour les problèmes auxquels ils sont confrontés dans leurs recherches centrées sur le génie mécanique ; pourtant, il leur manque les outils pour en tirer le meilleur parti “, explique Barbastathis. “Les ingénieurs en mécanique, en génie civil, en électricité et d’autres types d’ingénieurs veulent avoir une compréhension fondamentale des principes des données sans avoir à se convertir en data scientists ou en chercheurs en IA à plein temps.”

De plus, à mesure que les étudiants en génie mécanique passent du MIT à leur carrière, beaucoup d’entre eux devront un jour gérer des data scientists dans leurs équipes. M. Barbastathis espère que le cours 2.C161 permettra à ces étudiants de réussir.

Un pont entre MechE et le Collège d’informatique Schwartzman du MIT

La classe 2.C161 fait partie du “Computing Core” du MIT Schwartzman College of Computing. L’objectif de ces cours est de connecter la science des données et les disciplines d’ingénierie basées sur la physique, comme l’ingénierie mécanique. Les étudiants suivent ce cours parallèlement au cours 6.C402 (Modeling with Machine Learning : from Algorithms to Applications), enseigné par les professeurs d’ingénierie électrique et d’informatique Regina Barzilay et Tommi Jaakkola.

Les deux classes sont enseignées simultanément pendant le semestre, exposant les étudiants à la fois aux principes fondamentaux de l’apprentissage automatique et aux applications spécifiques au domaine de l’ingénierie mécanique.

En 2.C161, M. Barbastathis souligne la complémentarité de l’ingénierie basée sur la physique et de la science des données. Les lois physiques présentent un certain nombre d’ambiguïtés et d’inconnues, allant de la température et de l’humidité aux forces électromagnétiques. La science des données peut être utilisée pour prédire ces phénomènes physiques. Parallèlement, une bonne compréhension des systèmes physiques permet de s’assurer que le résultat d’un algorithme est précis et explicable.

“Ce qu’il faut, c’est une compréhension combinée plus approfondie des phénomènes physiques associés et des principes de la science des données, de l’apprentissage automatique en particulier, pour combler l’écart”, ajoute Barbastathis. “En combinant les données avec les principes physiques, la nouvelle révolution de l’ingénierie basée sur la physique est relativement immunisée contre le problème de la “boîte noire” auquel sont confrontés d’autres types d’apprentissage automatique.”

Équipés d’une connaissance pratique des sujets d’apprentissage automatique couverts dans la classe 6.C402 et d’une compréhension plus profonde de la façon de jumeler la science des données avec la physique, les étudiants sont chargés de développer un projet final qui résout un système physique réel.

Développer des solutions pour des systèmes physiques du monde réel

Pour leur projet final, les étudiants du cours 2.C161 sont invités à identifier un problème du monde réel qui nécessite la science des données pour résoudre l’ambiguïté inhérente aux systèmes physiques. Après avoir obtenu toutes les données pertinentes, les élèves sont invités àsélectionner une méthode d’apprentissage automatique, mettre en œuvre la solution qu’ils ont choisie, et présenter et critiquer les résultats.

Les sujets du semestre dernier allaient des prévisions météorologiques au flux de gaz dans les moteurs à combustion, avec deux équipes d’étudiants s’inspirant de la pandémie actuelle de Covid-19.

Owens et ses coéquipiers, les étudiants diplômés Arun Krishnadas et Joshua David John Rathinaraj, ont entrepris de développer un modèle pour le déploiement du vaccin Covid-19.

“Nous avons mis au point une méthode permettant de combiner un réseau neuronal avec un modèle épidémiologique susceptible d’être infecté et récupéré (SIR) afin de créer un système de prédiction basé sur la physique pour la propagation du Covid-19 après le début des vaccinations”, explique Owens.

L’équipe a pris en compte diverses inconnues, notamment la mobilité de la population, la météo et le climat politique. Cette approche combinée a permis de prédire la propagation du Covid-19 pendant le déploiement du vaccin de manière plus fiable qu’en utilisant uniquement le modèle SIR ou un réseau neuronal.

Une autre équipe, comprenant l’étudiant diplômé Yiwen Hu, a développé un modèle pour prédire les taux de mutation dans le Covid-19, un sujet qui est devenu très pertinent lorsque la variante delta a commencé à se répandre dans le monde.

“Nous avons utilisé l’apprentissage automatique pour prédire le taux de mutation de Covid-19 basé sur des séries temporelles, puis nous l’avons incorporé comme paramètre indépendant dans la prédiction de la dynamique de la pandémie pour voir si cela pouvait nous aider à mieux prédire la tendance de la pandémie de Covid-19 “, explique Hu.

Hu, qui avait précédemment mené des recherches sur la façon dont les vibrations des pointes de protéines de coronavirus affectent les taux d’infection, espère appliquer les approches d’apprentissage automatique basées sur la physique qu’il a apprises dans le cadre du projet 2.C161 à ses recherches sur la conception de protéines de novo.

Quel que soit le système physique abordé par les étudiants dans leurs projets finaux, M. Barbastathis a pris soin de souligner un objectif commun : la nécessité d’évaluer les implications éthiques de la science des données. Alors que les méthodes informatiques plus traditionnelles, comme la reconnaissance des visages ou de la voix, se sont révélées très problématiques sur le plan éthique, il est possible de combiner les systèmes physiques et l’apprentissage automatique de manière équitable et éthique.

“Nous devons veiller à ce que la collecte et l’utilisation des données se fassent de manière équitable et inclusive, en respectant la diversité de notre société et en évitant les problèmes bien connus auxquels les informaticiens se sont heurtés par le passé”, déclare M. Barbastathis.

M. Barbastathis espère qu’en encourageant les étudiants en génie mécanique à se familiariser avec l’éthique et à bien connaître la science des données, ils pourront développer des solutions et des prédictions fiables et éthiques pour des défis d’ingénierie physique.

Leave a Comment