Visualisations de données : quand plus de données COVID-19 n’égalent pas plus de compréhension

Avatar photo
Sophisticated Data Visualization Techniques
Techniques sophistiquées de visualisation de données

Des chercheurs du MIT ont découvert que les sceptiques de Covid-19 sur Twitter et Facebook – loin d’être « analphabètes » – utilisent souvent des techniques sophistiquées de visualisation de données pour s’opposer aux précautions de santé publique comme les mandats de masque. Crédit : José-Luis Olivares, MIT

Les utilisateurs des médias sociaux partagent des tableaux et des graphiques – souvent avec les mêmes données sous-jacentes – pour préconiser des approches opposées à la pandémie.

Depuis le début de la pandémie de Covid-19, des tableaux et des graphiques ont aidé à communiquer des informations sur les taux d’infection, les décès et les vaccinations. Dans certains cas, de telles visualisations peuvent encourager des comportements qui réduisent la transmission du virus, comme le port d’un masque. En effet, la pandémie a été saluée comme la moment décisif pour la visualisation des données.

Mais de nouvelles découvertes suggèrent une image plus complexe. Une étude de AVEC montre comment les sceptiques du coronavirus ont rassemblé des visualisations de données en ligne pour argumenter contre orthodoxie de la santé publique sur les avantages des mandats de masque. De telles « contre-visualisations » sont souvent assez sophistiquées, utilisant des ensembles de données provenant de sources officielles et des méthodes de visualisation de pointe.

Les chercheurs ont passé au peigne fin des centaines de milliers de publications sur les réseaux sociaux et ont découvert que les sceptiques du coronavirus déploient souvent des contre-visualisations aux côtés de la même rhétorique de « suivre les données » que les experts en santé publique, mais les sceptiques plaident pour des politiques radicalement différentes. Les chercheurs concluent que les visualisations de données ne sont pas suffisantes pour transmettre l’urgence de la pandémie de Covid-19, car même les graphiques les plus clairs peuvent être interprétés à travers une variété de systèmes de croyances.

Visualisation du réseau des utilisateurs de Twitter

Cette figure montre une visualisation en réseau des utilisateurs de Twitter apparaissant dans la recherche. La couleur code la communauté et les nœuds sont dimensionnés en fonction de leur degré de connectivité. Crédit : Avec l’aimable autorisation des chercheurs

“Beaucoup de gens pensent que des mesures telles que les taux d’infection sont objectives”, explique Crystal Lee. «Mais ils ne le sont clairement pas, compte tenu du débat qu’il y a sur la façon de penser à la pandémie. C’est pourquoi nous disons que les visualisations de données sont devenues un champ de bataille.

La recherche sera présentée à la conférence de l’ACM sur les facteurs humains dans les systèmes informatiques en mai. Lee est l’auteur principal de l’étude et un doctorant du programme Histoire, anthropologie, science, technologie et société (HASTS) du MIT et du Laboratoire d’informatique et d’intelligence artificielle (CSAIL) du MIT, ainsi qu’un membre du Berkman Klein Center for Internet et société. Les co-auteurs incluent Graham Jones, membre de la faculté Margaret MacVicar en anthropologie; Arvind Satyanarayan, professeur adjoint en développement de carrière NBX au Département de génie électrique et informatique et CSAIL ; Tanya Yang, étudiante de premier cycle au MIT ; et Gabrielle Inchoco, étudiante de premier cycle au Wellesley College.

Alors que les visualisations de données prenaient de l’importance au début de la pandémie, Lee et ses collègues ont cherché à comprendre comment elles étaient déployées dans l’univers des médias sociaux. « Une hypothèse initiale était que si nous avions plus de visualisations de données, à partir de données collectées de manière systématique, les gens seraient alors mieux informés », explique Lee. Pour tester cette hypothèse, son équipe a mélangé des techniques informatiques avec des méthodes ethnographiques innovantes.

Ils ont utilisé leur approche informatique sur Twitter, grattant près d’un demi-million de tweets faisant référence à la fois à « Covid-19 » et aux « données ». Avec ces tweets, les chercheurs ont généré un graphe de réseau pour découvrir « qui retweete qui et qui aime qui », explique Lee. « Nous avons essentiellement créé un réseau de communautés qui interagissent les unes avec les autres. » Les clusters comprenaient des groupes comme la « communauté des médias américains » ou les « antimaskers ». Les chercheurs ont découvert que les groupes antimasques créaient et partageaient des visualisations de données autant, sinon plus, que les autres groupes.

Et ces visualisations n’étaient pas bâclées. “Ils sont pratiquement impossibles à distinguer de ceux partagés par les sources traditionnelles”, explique Satyanarayan. « Ils sont souvent aussi raffinés que les graphiques que vous vous attendez à rencontrer dans le journalisme de données ou les tableaux de bord de santé publique. »

« C’est une découverte très frappante », dit Lee. “Cela montre que caractériser les groupes antimasques comme illettrés ou ne s’engageant pas avec les données est empiriquement faux.”

Lee dit que cette approche informatique leur a donné une vue large des visualisations de données de Covid-19. « Ce qui est vraiment passionnant dans ce travail quantitatif, c’est que nous effectuons cette analyse à une très grande échelle. Je n’aurais jamais pu lire un demi-million de tweets. »

Mais l’analyse de Twitter avait une lacune. “Je pense que cela manque beaucoup de la granularité des conversations que les gens ont”, dit Lee. « Vous ne pouvez pas nécessairement suivre un seul fil de conversation au fur et à mesure qu’il se déroule. » Pour cela, les chercheurs se sont tournés vers une méthode de recherche anthropologique plus traditionnelle – avec une touche de l’ère d’Internet.

L’équipe de Lee a suivi et analysé les conversations sur les visualisations de données dans les groupes Facebook antimasques – une pratique qu’ils ont surnommée « deep lurking », une version en ligne de la technique ethnographique appelée « deep Hangout ». Lee dit que « comprendre une culture vous oblige à observer les événements informels quotidiens – pas seulement les grands événements formels. Le Deep Lurking est un moyen de transposer ces approches ethnographiques traditionnelles à l’ère numérique.

Les résultats qualitatifs de la cachette profonde semblaient cohérents avec les résultats quantitatifs de Twitter. Les antimaskers sur Facebook n’évitaient pas les données. Ils ont plutôt discuté de la manière dont les différents types de données ont été collectés et pourquoi. “Leurs arguments sont vraiment très nuancés”, déclare Lee. « C’est souvent une question de métriques. Par exemple, les groupes antimasques pourraient faire valoir que les visualisations du nombre d’infections pourraient être trompeuses, en partie à cause du large éventail d’incertitudes dans les taux d’infection, par rapport à des mesures telles que le nombre de décès. En réponse, les membres du groupe créaient souvent leurs propres contre-visualisations, s’instruisant même mutuellement sur les techniques de visualisation des données.

« J’ai assisté à des diffusions en direct où les gens partagent un écran et consultent le portail de données de l’État de Géorgie », explique Lee. « Ensuite, ils expliqueront comment télécharger les données et les importer dans Excel. »

Jones dit que “l’idée de la science des groupes antimasques n’est pas d’écouter passivement alors que les experts d’un endroit comme le MIT disent à tout le monde ce qu’il faut croire”. Il ajoute que ce genre de comportement marque un nouveau tournant pour un ancien courant culturel. « L’utilisation par les antimaskers de la littératie des données reflète des valeurs américaines profondément ancrées d’autonomie et d’anti-expertise qui remontent à la fondation du pays, mais leurs activités en ligne poussent ces valeurs dans de nouvelles arènes de la vie publique. »

Il ajoute que « donner un sens à ces dynamiques complexes aurait été impossible » sans le « leadership visionnaire de Lee dans la conception d’une collaboration interdisciplinaire qui s’étendait sur SHASS et CSAIL ».

La recherche sur les méthodes mixtes « fait progresser notre compréhension des visualisations de données en façonnant la perception publique de la science et de la politique », déclare Jevin West, data scientist au Université de Washington, qui n’a pas participé à la recherche. Les visualisations de données « portent un vernis d’objectivité et de précision scientifique. Mais comme le montre cet article, les visualisations de données peuvent être utilisées efficacement sur les côtés opposés d’un problème », dit-il. « Cela souligne la complexité du problème — qu’il ne suffit pas d’« enseigner simplement l’éducation aux médias ». Cela nécessite une compréhension sociopolitique plus nuancée de ceux qui créent et interprètent les graphiques de données. »

La combinaison de connaissances informatiques et anthropologiques a conduit les chercheurs à une compréhension plus nuancée de la littératie des données. Lee dit que leur étude révèle que, par rapport à l’orthodoxie de la santé publique, « les antimasques voient la pandémie différemment, en utilisant des données assez similaires. Je pense toujours que l’analyse des données est importante. Mais ce n’est certainement pas le baume que je pensais être pour convaincre les gens qui croient que l’establishment scientifique n’est pas digne de confiance. Lee dit que leurs découvertes indiquent “une plus grande fracture dans la façon dont nous pensons à la science et à l’expertise aux États-Unis”.

Pour rendre ces résultats accessibles au public, Lee et son collaborateur, le doctorant du CSAIL Jonathan Zong, ont dirigé une équipe de sept chercheurs de premier cycle du MIT pour développer un récit interactif où les lecteurs peuvent explorer les visualisations et les conversations par eux-mêmes.

Lee décrit la recherche de l’équipe comme une première étape pour donner un sens au rôle des données et des visualisations dans ces débats plus larges. « La visualisation des données n’est pas objective. Ce n’est pas absolu. C’est en fait une entreprise incroyablement sociale et politique. Nous devons être attentifs à la façon dont les gens les interprètent en dehors de l’establishment scientifique.

Référence : « Visualisations virales : Comment les sceptiques sur les coronavirus utilisent des pratiques de données orthodoxes pour promouvoir la science non orthodoxe en ligne » par Crystal Lee, Tanya Yang, Gabrielle D Inchoco, Graham M. Jones et Arvind Satyanarayan, 7 mai 2021, CHI ’21 : Actes de la conférence CHI 2021 sur les facteurs humains dans les systèmes informatiques.
DOI : 10.1145/3411764.3445211

Cette recherche a été financée, en partie, par la National Science Foundation et le Social Science Research Council.

Related Posts