Une équipe de recherche internationale dirigée par des scientifiques de l’université de Georgetown a démontré la puissance de l’intelligence artificielle pour prédire quels virus pourraient infecter les humains – comme le virus de la grippe aviaire. SRAS-CoV-2le virus à l’origine de l’épidémie de COVID-19 pandémie – quels animaux les hébergent et où ils pourraient apparaître.
Leur ensemble de modèles prédictifs des hôtes réservoirs probables, publié le 10 janvier dans la revue Lancet Microbe (“Optimizing predictive models to prioritize viral discovery in zoonotic reservoirs”)., a été validé dans le cadre d’un projet de 18 mois visant à identifier des espèces de chauves-souris spécifiques susceptibles d’être porteuses de bétacoronavirus, le groupe qui comprend les virus semblables au SRAS.
“Si vous voulez trouver ces virus, vous devez commencer par établir le profil de leurs hôtes – leur écologie, leur évolution, même la forme de leurs ailes”, explique l’auteur principal de l’étude, Colin Carlson, PhD, professeur assistant de recherche au département de microbiologie et d’immunologie et membre du Center for Global Health Science and Security du Georgetown University Medical Center. “L’intelligence artificielle nous permet de prendre des données sur les chauves-souris et de les transformer en prédictions concrètes : où devrions-nous chercher le prochain SRAS ?”.
Malgré les investissements mondiaux dans la surveillance des maladies, il reste difficile d’identifier et de surveiller les réservoirs sauvages de virus qui pourraient un jour infecter les humains. Les modèles statistiques sont de plus en plus utilisés pour déterminer les espèces sauvages à échantillonner en priorité sur le terrain, mais les prédictions générées par un modèle donné peuvent être très incertaines. De plus, les scientifiques suivent rarement le succès ou l’échec de leurs prédictions après les avoir faites, ce qui rend difficile l’apprentissage et l’élaboration de meilleurs modèles à l’avenir. Ensemble, ces limitations signifient qu’il existe une grande incertitude quant aux modèles les mieux adaptés à la tâche.
Cette nouvelle étude suggère que la recherche de virus étroitement apparentés pourrait ne pas être triviale, puisque plus de 400 espèces de chauves-souris dans le monde sont censées héberger des bétacoronavirus, un vaste groupe de virus qui comprend ceux qui sont responsables du SRAS-CoV (le virus qui a provoqué l’épidémie de SRAS de 2002-2004) et du SRAS-CoV-2 (le virus qui cause le COVID-19). Bien que l’origine du SARS-CoV-2 reste incertaine, la propagation d’autres virus par les chauves-souris est un problème croissant dû à des facteurs tels que l’expansion agricole et le changement climatique.
Greg Albery, PhD, chercheur postdoctoral au département de biologie de Georgetown, explique que le COVID-19 a donné l’impulsion nécessaire pour accélérer leurs recherches. “C’est une opportunité vraiment rare”, explique Albery. “En dehors d’une pandémie, nous n’aurions jamais appris autant de choses sur ces virus dans un délai aussi court. Une décennie de recherche a été réduite à environ un an de publications, et cela signifie que nous pouvons réellement montrer que ces outils fonctionnent.”
Au cours du premier trimestre de 2020, l’équipe de chercheurs a formé huit modèles statistiques différents qui ont prédit quels types d’animaux pouvaient accueillir des bétacoronavirus. Pendant plus d’un an, l’équipe a ensuite suivi la découverte de 40 nouvelles chauves-souris hôtes de bêtacoronavirus afin de valider les prédictions initiales et de mettre à jour dynamiquement leurs modèles. Les chercheurs ont constaté que les modèles exploitant les données sur l’écologie et l’évolution des chauves-souris étaient extrêmement performants pour prédire les nouveaux hôtes. En revanche, les modèles de pointe issus de la science des réseaux qui utilisaient des mathématiques de haut niveau – mais moins de données biologiques – ont donné des résultats à peu près aussi bons ou moins bons que prévu au hasard.
“L’une des choses les plus importantes que notre étude nous donne est une liste restreinte, basée sur des données, des espèces de chauves-souris qui devraient être étudiées plus avant”, déclare Daniel Becker, docteur en philosophie, professeur adjoint de biologie à l’université d’Oklahoma. “Après avoir identifié ces hôtes probables, l’étape suivante consiste alors à investir dans la surveillance pour comprendre où et quand les bétacoronavirus sont susceptibles de se répandre.”
Carlson indique que l’équipe travaille maintenant avec d’autres scientifiques du monde entier pour tester des échantillons de chauves-souris pour les coronavirus en fonction de leurs prédictions.
“Si nous dépensons moins d’argent, de ressources et de temps à rechercher ces virus, nous pouvons consacrer toutes ces ressources à des choses qui sauvent réellement des vies à l’avenir. Nous pouvons investir dans la construction de vaccins universels pour cibler ces virus, ou dans la surveillance de la propagation chez les personnes qui vivent près des chauves-souris”, explique M. Carlson. “C’est une situation gagnant-gagnant pour la science et la santé publique”.
Référence : “Optimisation des modèles prédictifsto prioritise viral discovery in zoonotic reservoirs” par Daniel J Becker, PhD ; Gregory F Albery, PhD ; Anna R Sjodin, PhD ; Timothée Poisot, PhD ; Laura M Bergner, PhD ; Binqi Chen ; Lily E Cohen, MPhil ; Tad A Dallas, PhD ; Evan A Eskew, PhD ; Anna C Fagre, DVM ; Maxwell J Farrell, PhD ; Sarah Guth, BA ; Barbara A Han, PhD ; Nancy B Simmons, PhD ; Michiel Stock, PhD ; Emma C Teeling, PhD et Colin J Carlson, PhD, 10 janvier 2022, The Lancet Microbe.
DOI: 10.1016/S2666-5247(21)00245-7
Des collaborateurs de l’Université de l’Idaho, de l’Université d’État de Louisiane, de l’Université de Californie Berkeley, de l’Université d’État du Colorado, de l’Université Pacific Lutheran et de l’École de médecine Icahn de Mount Sinai ont également participé à l’étude, Université de Glasgow, l’Université de Montréal, l’Université de Toronto, l’Université de Gand, le Collège universitaire de Dublin, le Cary Institute of Ecosystem Studies et l’American Museum of Natural History.
Les auteurs font partie du consortium Viral Emergence Research Initiative (VERENA), qui gère le plus grand écosystème de données ouvertes dans le domaine de l’écologie virale et crée des outils permettant de prédire quels virus pourraient infecter les humains, quels animaux les hébergent et où ils pourraient un jour émerger. Carlson et Albery sont cofondateurs.
Les auteurs déclarent n’avoir aucun intérêt financier personnel lié à cette étude. Le soutien de VERENA est assuré par l’Institut de Valorisation de Donne’es de l’Université de Montréal et par la US National Science Foundation (BII 2021909). Un financement supplémentaire pour l’étude a été fourni par le Wellcome Trust et la Fondation pour la recherche, le gouvernement flamand dans le cadre du programme Onderzoeksprogramma Artificie¨le Intelligentie Vlaanderen.