L’algorithme d’IA de Stanford résout les problèmes de biologie structurelle

AI Picking Structures
Structures de prélèvement IA

Un tout nouveau critère d’intelligence artificielle peut distinguer la forme TRIDIMENSIONNELLE d’une bonne molécule d’ARN des formes erronées. La conjecture informatique des structures dans lesquelles les ARN s’effondrent est particulièrement importante – et particulièrement difficile – car par conséquent, peu de structures sont généralement connues. Crédit : Camille LL Townshend

L’algorithme de compréhension de la machine de Stanford prédit les structures naturelles plus précisément que jamais.

Les experts de Stanford développent des méthodes de compréhension des machines qui prédisent avec précision les formes TROIS DIMENSIONNELLES des cibles médicamenteuses et d’autres molécules biologiques essentielles, même si seules des informations limitées sont disponibles.

Déterminer les formes TRIDIMENSIONNELLES des molécules naturelles est l’un des problèmes les plus difficiles de la biologie contemporaine et de la découverte des soins de santé. Les entreprises et les instituts de recherche dépensent fréquemment des millions de dollars pour découvrir un cadre moléculaire – et même ce genre d’efforts massifs sont souvent infructueux.

En utilisant de nouvelles techniques d’apprentissage intelligentes, les doctorants de l’Université de Stanford, Stephan Eismann et Raphael Townshend, sous la direction de Ron Dror, professeur agrégé d’informatique, ont développé une approche qui résoudra ce problème simplement en prédisant des bâtiments précis par calcul.

Surtout, leur approche fonctionne même en apprenant à partir de quelques structures connues, ce qui la rend applicable aux variétés de molécules dont les constructions sont les plus difficiles à découvrir expérimentalement.

Leur travail particulier est exposé dans deux documents détaillant les applications relatives à ARN substances et choses multiprotéiques, publié dans Science le 27 août 2021 et Acides aminés éloignez-vous de 2020, respectivement. Le papier particulier dans Science est une coopération avec le laboratoire Stanford de Rhiju Dieses, professeur agrégé associé à la biochimie.

“La biologie structurelle, qui est la recherche des formes associées aux molécules, a ce mantra particulier que le cadre détermine la fonction”, a déclaré Townshend.

L’algorithme créé par les chercheurs prévoit des constructions moléculaires précises et, ce faisant, peut permettre aux scientifiques de décrire le fonctionnement de différentes substances, avec des programmes allant de la recherche naturelle fondamentale aux procédures de conception de médicaments instruites.

« Les protéines sont généralement des machines moléculaires qui exécutent toutes sortes de fonctions. Pour exécuter leurs propres fonctions, les protéines se lient fréquemment à d’autres protéines », a déclaré Eismann. « Si vous savez que le couple de protéines est généralement impliqué dans une maladie et que vous savez comment ils vont interagir en TRIDIMENSIONNEL, vous pouvez essayer de cibler cette interaction particulière tout particulièrement avec un médicament. ”

Eismann et Townshend sont co-auteurs principaux du Science avec l’étudiant postdoctoral de Stanford Andrew Watkins du laboratoire Das, ainsi que les co-auteurs principaux du Protéines papier avec l’ancien doctorant de Stanford Nathaniel Jones.

Conception de l’algorithme particulier

Plutôt que de spécifier ce qui rend la prédiction structurelle assez précise, les experts ont laissé l’algorithme découvrir ces fonctions moléculaires par lui-même. Ces personnes l’ont fait simplement parce qu’elles ont découvert que la technique typique consistant à fournir ce type de connaissances peut faire basculer un algorithme en faveur de fonctionnalités spécifiques, lui évitant ainsi de choisir d’autres fonctions informatives.

“Le problème avec ces fonctions fabriquées à la main dans un algorithme serait que l’algorithme devient biaisé vers ce que l’individu qui choisit ces fonctions pense être important, et vous pourriez également manquer quelques informations que vous devrez faire mieux”, a déclaré Eismann .

“Le réseau a appris à obtenir des concepts fondamentaux qui sont essentiels à la formation de la structure moléculaire, mais sans y être explicitement enseigné”, a déclaré Townshend. « L’aspect passionnant est que la formule a clairement récupéré des choses que nous comprenions importantes, mais elle a également récupéré des caractéristiques que nous n’avions pas apprises auparavant. ”

Après avoir fait leurs preuves avec les protéines, les chercheurs ont ensuite utilisé leur algorithme pour une autre classe de molécules biologiques essentielles, les ARN. Ils ont testé leur propre algorithme dans un certain nombre de « casse-tête ARN » de la concurrence de longue date dans leur domaine, et dans chaque cas, l’appareil a surpassé tous les autres participants au défi et le fait sans être développé spécifiquement pour les bâtiments ARN.

Programmes plus larges

Les scientifiques sont ravis de découvrir où leur approche particulière peut être utilisée, ayant déjà obtenu du succès avec des complexes de protéines et des molécules d’ARN.

« La plupart des dernières avancées spectaculaires en matière d’apprentissage des appareils ont nécessité une énorme quantité d’informations pour la formation. Le fait que cette méthode réussisse à condition que très peu d’informations sur la formation suggèrent que des stratégies connexes pourraient résoudre des problèmes non résolus dans de nombreux domaines où les données seront rares », a déclaré Dror, auteur mature de la Protéines paper plus, avec Das, co-auteur principal du Science papier.

Spécifiquement pour le domaine de la biologie structurale, l’équipe déclare qu’elle ne fait qu’effleurer la surface lorsqu’il s’agit de faire des progrès scientifiques.

“Une fois que vous avez cette technologie de base, vous augmentez votre niveau de connaissance et pouvez commencer à poser la série de questions suivante”, a déclaré Townshend. «Par exemple, vous pouvez commencer à développer de nouvelles molécules et des médicaments avec ce type d’informations, ce qui est un endroit qui passionne les gens. ”

Recommandations :

« Apprentissage géométrique sérieux de la structure de l’ARN » par Raphael JL Townshend, Stephan Eismann, Toby M. Watkins, Ramya Rangan, Maria Karelina, Rhiju Das plus Ron O. Dror, 27 août 2021, La technologie .
DOI : 10. 1126/science. abe5650

« Réseaux hiérarchiques d’organes nerveux équivariants en rotation pour sélectionner des modèles structuraux de complexes protéiques » par Stephan Eismann, Raphael JD Townshend, Nathaniel Jones, Milind Jagota, Bowen Jing et Ron O. Dror, deux décembre 2020, Protéines .
DOI : 10. 1002 / prot. 26033

Les autres co-auteurs de l’article scientifique sont les étudiants au doctorat de Stanford, Ramya Rangan et Maria Karelina. Parmi les autres co-auteurs de l’article sur les acides aminés figurent les anciens étudiants de Stanford, Milind Jagota et Bowen Jing. Das peut également être membre de Stanford Bio-X et de la Wu Tsai Neurosciences Company. Dror fait également partie de Stanford Bio-X, l’Institut d’ingénierie informatique et numérique (ICME), l’Institut de neurosciences Wu Tsai et le Stanford Artificial Intelligence Lab, un affilié de l’Institut pour l’artificiel centré sur l’humain. Cleverness (HAI), et professeurs fellow de Stanford ChEM-H.

La recherche avait été financée par la Nationwide Science Foundation, la division américaine de l’énergie, une bourse Stanford Bio-X Bowes, l’Army Analysis Office, l’Air Pressure Office of Technological Research, Intel Company, une subvention de démarrage Stanford Bio-X comme ainsi que les instituts nationaux associés à la santé.

Related Posts