L’IA peut prédire que le prochain virus à haut risque passera des animaux aux humains

Virus DNA Genetic Analysis Concept

Concept d'analyse génétique de l'ADN du virus

La plupart des maladies infectieuses émergentes chez l’homme (comme COVID-19[feminine) sont zoonotiques – causées par des virus provenant d’autres espèces animales. L’identification précoce des virus à haut risque peut améliorer les priorités de recherche et de surveillance. Une étude publiée dans PLOS Biologie le 28 septembree par Nardus Mollentze, Simon Babayan et Daniel Streicker à Université de Glasgow, Royaume-Uni suggère que l’apprentissage automatique (un type d’intelligence artificielle) utilisant des génomes viraux peut prédire la probabilité qu’un virus infectant les animaux infecte les humains, compte tenu d’une exposition biologiquement pertinente.

L’identification des maladies zoonotiques avant leur émergence est un défi majeur car seule une petite minorité des 1,67 million de virus animaux estimés sont capables d’infecter l’homme. Pour développer des modèles d’apprentissage automatique utilisant des séquences de génome viral, les chercheurs ont d’abord compilé un ensemble de données de 861 espèces de virus de 36 familles. Ils ont ensuite construit des modèles d’apprentissage automatique, qui ont attribué une probabilité d’infection humaine en fonction des modèles de génomes viraux. Les auteurs ont ensuite appliqué le modèle le plus performant pour analyser les tendances du potentiel zoonotique prédit de génomes de virus supplémentaires échantillonnés à partir d’une gamme d’espèces.

Chauves-souris capturées pendant la surveillance des virus zoonotiques

Chauves-souris capturées lors des efforts de surveillance des virus zoonotiques (Madre de Dios, Pérou). Crédit : Daniel Streicker, Mollentze N, et al., PLOS Biology, CC-BY 4.0

Les chercheurs ont découvert que les génomes viraux peuvent avoir des caractéristiques généralisables qui sont indépendantes des relations taxonomiques virales et peuvent préadapter les virus pour infecter les humains. Ils ont pu développer des modèles d’apprentissage automatique capables d’identifier des zoonoses candidates à l’aide de génomes viraux. Ces modèles ont des limites, car les modèles informatiques ne sont qu’une étape préliminaire de l’identification des virus zoonotiques ayant le potentiel d’infecter les humains. Les virus signalés par les modèles nécessiteront des tests de laboratoire de confirmation avant de poursuivre des investissements de recherche supplémentaires majeurs. De plus, bien que ces modèles prédisent si les virus pourraient infecter les humains, la capacité d’infecter n’est qu’une partie du risque zoonotique plus large, qui est également influencé par la virulence du virus chez l’homme, sa capacité à se transmettre entre humains et les conditions écologiques. au moment de l’exposition humaine.

Selon les auteurs, « nos résultats montrent que le potentiel zoonotique des virus peut être inféré dans une large mesure étonnamment à partir de leur séquence génomique. En mettant en évidence les virus présentant le plus grand potentiel de devenir zoonotique, le classement basé sur le génome permet de cibler plus efficacement une caractérisation écologique et virologique plus poussée. »

“Ces résultats ajoutent un élément crucial à la quantité déjà surprenante d’informations que nous pouvons extraire de la séquence génétique des virus à l’aide de techniques d’IA”, ajoute Babayan. « Une séquence génomique est généralement la première, et souvent la seule, information que nous ayons sur les virus nouvellement découverts, et plus nous pouvons en extraire d’informations, plus tôt nous pourrons identifier les origines du virus et le risque zoonotique qu’il peut poser. Au fur et à mesure que de plus en plus de virus sont caractérisés, plus nos modèles d’apprentissage automatique deviendront efficaces pour identifier les virus rares qui doivent être étroitement surveillés et priorisés pour le développement préventif de vaccins. »

Référence : “Identifying and prioritizing potential human-infecting virus from their genome sequences” par Nardus Mollentze, Simon A. Babayan et Daniel G. Streicker, 28 septembre 2021, Biologie PLoS.
DOI : 10.1371/journal.pbio.3001390

Related Posts