L’Atlas des cellules humaines est le plus grand atlas de référence unicellulaire en croissance au monde. Il contient des références de millions de cellules à travers les tissus, les organes et les stades de développement. Ces références aident les médecins à comprendre les influences du vieillissement, de l’environnement et de la maladie sur une cellule – et finalement à mieux diagnostiquer et traiter les patients. Pourtant, les atlas de référence ne vont pas sans défis. Les ensembles de données à cellule unique peuvent contenir des erreurs de mesure (effet batch), la disponibilité globale des ressources de calcul est limitée et le partage des données brutes est souvent limité par la loi.
Des chercheurs du Helmholtz Zentrum München et de l’Université technique de Munich (TUM) ont développé un nouvel algorithme appelé « scArches », abréviation de chirurgie d’architecture unicellulaire. Le plus gros avantage : « Au lieu de partager des données brutes entre des cliniques ou des centres de recherche, l’algorithme utilise l’apprentissage par transfert pour comparer de nouveaux ensembles de données de la génomique unicellulaire avec des références existantes et préserve ainsi la confidentialité et l’anonymat. Cela facilite également l’annotation et l’interprétation de nouveaux ensembles de données et démocratise considérablement l’utilisation d’atlas de référence à cellule unique », explique Mohammad Lotfollahi, le principal scientifique de l’algorithme.
Exemple COVID-19
Les chercheurs ont appliqué scArches pour étudier COVID-19[feminine dans plusieurs échantillons bronchiques pulmonaires. Ils ont comparé les cellules de patients COVID-19 à des références saines en utilisant la transcriptomique unicellulaire. L’algorithme a été capable de séparer les cellules malades des références et a ainsi permis à l’utilisateur d’identifier les cellules nécessitant un traitement, pour les cas de COVID-19 légers et graves. La variation biologique entre les patients n’a pas affecté la qualité du processus de cartographie.
Fabian Theis : « Notre vision est qu’à l’avenir, nous utiliserons les références cellulaires aussi facilement que nous le faisons aujourd’hui pour les références génomiques. En d’autres termes, si vous voulez faire un gâteau, vous ne voulez généralement pas essayer de créer votre propre recette – au lieu de cela, vous n’avez qu’à en chercher une dans un livre de cuisine. Avec scArches, nous formalisons et simplifions ce processus de recherche.
En savoir plus sur scArches : https://github.com/theislab/scarches
Référence : « Mapping single-cell data to reference atlas by transfer learning » par Mohammad Lotfollahi, Mohsen Naghipourfar, Malte D. Luecken, Matin Khajavi, Maren Büttner, Marco Wagenstetter, Žiga Avsec, Adam Gayoso, Nir Yosef, Marta Interlandi, Sergei Rybakov , Alexander V. Misharin et Fabian J. Theis, 30 août 2021, Biotechnologie naturelle.
DOI : 10.1038 / s41587-021-01001-7
Le biologiste informatique Mohammad Lotfollahi est chef d’équipe au laboratoire de Fabian Theis au Helmholtz Zentrum München et doctorant à la TUM School of Life Sciences de l’Université technique de Munich. Il travaille en étroite collaboration avec Fabian Theis, directeur de l’Institut de biologie computationnelle à Helmholtz Zentrum München et coordinateur de l’unité de coopération Helmholtz en intelligence artificielle (Helmholtz AI). Theis est titulaire de la chaire de modélisation mathématique des systèmes biologiques à la TUM.