Un nouveau système d’apprentissage automatique signale des remèdes médicaux qui pourraient faire plus de mal que de bien

Machine-Learning System Scores Medical Treatments
Le système d'apprentissage automatique évalue les traitements médicaux

Un nouveau système d’apprentissage automatique pourrait donner aux médecins des scores de risque pour différents traitements. Crédit : Christine Daniloff, MIT, images d’archives

Le système pourrait aider les médecins à sélectionner les traitements les moins risqués dans les situations d’urgence, comme le traitement de la septicémie.

Le sepsis coûte la vie à près de 270 000 personnes aux États-Unis chaque année. La condition médicale imprévisible peut évoluer rapidement, entraînant une chute rapide de la pression artérielle, des lésions tissulaires, une défaillance de plusieurs organes et la mort.

Les interventions rapides des professionnels de la santé sauvent des vies, mais certains traitements contre la septicémie peuvent également contribuer à la détérioration d’un patient. Par conséquent, le choix du traitement optimal peut être une tâche difficile. Par exemple, dans les premières heures d’une septicémie grave, l’administration d’une trop grande quantité de liquide par voie intraveineuse peut augmenter le risque de décès d’un patient.

Pour aider les cliniciens à éviter les remèdes susceptibles de contribuer au décès d’un patient, les chercheurs de AVEC et ailleurs ont développé un modèle d’apprentissage automatique qui pourrait être utilisé pour identifier les traitements qui présentent un risque plus élevé que d’autres options. Leur modèle peut également avertir les médecins lorsqu’un patient septique approche d’une impasse médicale – le moment où le patient mourra très probablement quel que soit le traitement utilisé – afin qu’ils puissent intervenir avant qu’il ne soit trop tard.

Lorsqu’il est appliqué à un ensemble de données de patients atteints de sepsis dans une unité de soins intensifs d’un hôpital, le modèle des chercheurs a indiqué qu’environ 12% des traitements administrés aux patients décédés étaient préjudiciables. L’étude révèle également qu’environ 3 pour cent des patients qui n’ont pas survécu sont entrés dans une impasse médicale jusqu’à 48 heures avant leur décès.

« Nous constatons que notre modèle a presque huit heures d’avance sur la reconnaissance par un médecin de la détérioration d’un patient. C’est puissant parce que dans ces situations vraiment sensibles, chaque minute compte, et être conscient de l’évolution du patient et du risque d’administrer certains traitements à un moment donné est vraiment important », explique Taylor Killian, un étudiant diplômé de la Groupe ML sain du Laboratoire d’informatique et d’intelligence artificielle (CSAIL).

Son conseiller, le professeur adjoint Marzyeh Ghassemi, chef du groupe Healthy ML et auteur principal, rejoignent Killian sur le papier ; l’auteur principal Mehdi Fatemi, chercheur principal chez Microsoft Research ; et Jayakumar Subramanian, chercheur principal chez Adobe India. La recherche est présentée à la conférence de cette semaine sur les systèmes de traitement de l’information neuronale.

Une pénurie de données

Ce projet de recherche a été stimulé par un article de 2019 écrit par Fatemi qui explorait l’utilisation de l’apprentissage par renforcement dans des situations où il est trop dangereux d’explorer des actions arbitraires, ce qui rend difficile la génération de suffisamment de données pour entraîner efficacement des algorithmes. Ces situations, où davantage de données ne peuvent pas être collectées de manière proactive, sont appelées paramètres « hors ligne ».

Dans l’apprentissage par renforcement, l’algorithme est entraîné par essais et erreurs et apprend à prendre des mesures qui maximisent son accumulation de récompense. Mais dans un cadre de soins de santé, il est presque impossible de générer suffisamment de données pour que ces modèles apprennent le traitement optimal, car il n’est pas éthique d’expérimenter des stratégies de traitement possibles.

Ainsi, les chercheurs ont renversé l’apprentissage par renforcement. Ils ont utilisé les données limitées d’une unité de soins intensifs d’un hôpital pour former un modèle d’apprentissage par renforcement afin d’identifier les traitements à éviter, dans le but d’empêcher un patient d’entrer dans une impasse médicale.

Apprendre ce qu’il faut éviter est une approche statistiquement plus efficace qui nécessite moins de données, explique Killian.

« Quand nous pensons aux impasses en conduisant une voiture, nous pourrions penser que c’est la fin de la route, mais vous pourriez probablement classer chaque pied le long de cette route vers l’impasse comme une impasse. Dès que vous vous détournez d’un autre itinéraire, vous êtes dans une impasse. C’est donc ainsi que nous définissons une impasse médicale : une fois que vous êtes sur une voie où, quelle que soit la décision que vous prenez, le patient progressera vers la mort », explique Killian.

« Une idée centrale ici est de diminuer la probabilité de sélectionner chaque traitement proportionnellement à sa chance de forcer le patient à entrer dans une impasse médicale – une propriété que l’on appelle la sécurité du traitement. C’est un problème difficile à résoudre car les données ne nous donnent pas directement un tel aperçu. Nos résultats théoriques nous ont permis de reformuler cette idée de base comme un problème d’apprentissage par renforcement », explique Fatemi.

Pour développer leur approche, appelée Dead-end Discovery (DeD), ils ont créé deux copies d’un réseau de neurones. Le premier réseau de neurones se concentre uniquement sur les résultats négatifs – lorsqu’un patient est décédé – et le second réseau se concentre uniquement sur les résultats positifs – lorsqu’un patient a survécu. L’utilisation séparée de deux réseaux de neurones a permis aux chercheurs de détecter un traitement à risque dans l’un, puis de le confirmer à l’aide de l’autre.

Ils ont alimenté chaque réseau de neurones des statistiques de santé des patients et une proposition de traitement. Les réseaux produisent une valeur estimée de ce traitement et évaluent également la probabilité que le patient entre dans une impasse médicale. Les chercheurs ont comparé ces estimations pour définir des seuils pour voir si la situation soulève des drapeaux.

Un drapeau jaune signifie qu’un patient entre dans une zone préoccupante tandis qu’un drapeau rouge identifie une situation où il est très probable que le patient ne se rétablira pas.

Le traitement compte

Les chercheurs ont testé leur modèle à l’aide d’un ensemble de données de patients présumés septiques de l’unité de soins intensifs du Beth Israel Deaconess Medical Center. Cet ensemble de données contient environ 19 300 admissions avec des observations tirées d’une période de 72 heures centrée sur le moment où les patients manifestent pour la première fois des symptômes de sepsis. Leurs résultats ont confirmé que certains patients de l’ensemble de données ont rencontré des impasses médicales.

Les chercheurs ont également découvert que 20 à 40 pour cent des patients qui n’ont pas survécu ont levé au moins un drapeau jaune avant leur mort, et beaucoup ont levé ce drapeau au moins 48 heures avant leur mort. Les résultats ont également montré que, lorsque l’on compare les tendances des patients qui ont survécu par rapport aux patients qui sont décédés, une fois qu’un patient lève son premier drapeau, il y a un écart très marqué dans la valeur des traitements administrés. La fenêtre de temps autour du premier drapeau est un point critique lors de la prise de décisions de traitement.

« Cela nous a aidés à confirmer que le traitement est important et que le traitement diffère en fonction de la façon dont les patients survivent et de la façon dont les patients ne survivent pas. Nous avons constaté que plus de 11 % des traitements sous-optimaux auraient pu être évités car il y avait de meilleures alternatives disponibles pour les médecins à ces moments-là. C’est un nombre assez substantiel, si l’on considère le volume mondial de patients qui ont été septiques à l’hôpital à un moment donné », a déclaré Killian.

Ghassemi s’empresse également de souligner que le modèle est destiné à aider les médecins, pas à les remplacer.

« Les cliniciens humains sont ceux que nous voulons pour prendre des décisions concernant les soins, et les conseils sur le traitement à éviter ne changeront rien à cela », dit-elle. « Nous pouvons reconnaître les risques et ajouter des garde-fous pertinents en fonction des résultats de 19 000 traitements de patients, ce qui équivaut à un seul soignant voyant plus de 50 résultats de patients septiques chaque jour pendant une année entière. »

À l’avenir, les chercheurs souhaitent également estimer les relations causales entre les décisions de traitement et l’évolution de la santé des patients. Ils prévoient de continuer à améliorer le modèle afin qu’il puisse créer des estimations d’incertitude autour des valeurs de traitement qui aideraient les médecins à prendre des décisions plus éclairées. Une autre façon de valider davantage le modèle serait de l’appliquer aux données d’autres hôpitaux, ce qu’ils espèrent faire à l’avenir.

Référence: “Impasses médicales et apprentissage pour identifier les états et les traitements à haut risque» par Mehdi Fatemi, Taylor W. Killian, Jayakumar Subramanian et Marzyeh Ghassemi, Actes NeurIPS.

Cette recherche a été financée en partie par Microsoft Research, une chaire Azrieli Global Scholar de l’Institut canadien de recherches avancées, une chaire du Conseil de recherches du Canada et une subvention à la découverte du Conseil de recherches en sciences naturelles et en génie du Canada.

Related Posts