Le Big Data Ne Vous Sauvera Pas Du Coronavirus

Le Big Data ne vous sauvera pas du CoronavirusImage ©Pixabay

À une époque où tout semble quantifiable, il est troublant de constater que les informations que nous avons sur cette épidémie mortelle sont au mieux approximatives.

Les difficultés d'avoir des données fiables

À quelle fréquence voyez-vous une information économique ou financière révisée à la hausse de 45%?
Et dans quelle mesure considéreriez-vous un ensemble de données soumis à de tels ajustements?

C'est le problème auquel sont confrontés les épidémiologistes qui tentent de comprendre le nouveau coronavirusqui se propage depuis la province chinoise du Hubei. Jeudi, le décompte y a bondi de 45% - soit 14 480 cas. La révision était en grande partie due aux autorités sanitaires qui ont ajouté les patients diagnostiqués sur la base des examens pulmonaires à un décompte précédent, qui était principalement limité à ceux dont les tests sur écouvillon étaient revenus positifs.

Les données médicales provenant des hôpitaux et des cliniques du monde entier sont inestimables pour déterminer comment cette épidémie évoluera - mais le tableau peint par les informations change presque aussi vite que la maladie elle-même, et n'est pas toujours d'une provenance irréprochable. Tout comme les nouvelles infections exploitent les faiblesses des défenses immunitaires de l'organisme, les épidémies ont une habitude déconcertante de repérer les vulnérabilités de la société fondée sur les données que nous nous sommes bâtie.

Des données épidémiologiques incertaines

Ce n'est pas une pensée réconfortante. Nous vivons à une époque où tout semble quantifiable, de nos mouvements quotidiensà nos habitudes de recherche sur Internetet même nos battements de cœur. À une époque où les gens ont peur et recherchent la certitude, il est alarmant que les connaissances que nous avons sur cette question la plus importante soient au mieux un guide approximatif de ce qui se passe.

«Il est si facile de nos jours de capturer des données sur quoi que ce soit, mais en donner un sens n'est pas facile du tout», a déclaré John Carlin, professeur à l'Université de Melbourne, spécialisé en statistiques médicales et en épidémiologie. «Il y a vraiment beaucoup d'incertitude, mais ce n'est pas ce que les gens veulent savoir. Ils veulent savoir que c'est sous contrôle. »

C'est le plus visible dans les informations contradictoires que nous voyons sur le nombre de personnes infectées et sur la proportion d'entre elles qui sont décédées. Bien que ces chiffres soient essentiels pour comprendre la situation, comme nous l'avons fait valoir, ils sont sujets à des erreurs d'échantillonnage et de mesurequi sont aggravées dans des circonstances tendues et à haute pression. La capacité physique de faire des tests et des diagnostics en temps opportun ne peut pas non plus être tenue pour acquise, comme l'a écrit mon collègue Max Nisen.

Les taux de létalité précoce pour le syndrome respiratoire aigu sévère étaient souvent de 40% ou plus avant de se fixer à des chiffres de l'ordre de 15% ou moins. L'âge des patients, qu'ils tombent malades dans la communauté ou à l'hôpital, ainsi que la capacité et l'expérience des médecins à offrir des traitements peuvent tous affecter considérablement ces chiffres.

Même la façon dont les cas de coronavirus sont définis et comptés a changé plusieurs fois, a déclaré le professeur Raina MacIntyre, responsable du programme de recherche en biosécurité de l'Université de Nouvelle-Galles du Sud: De la «pneumonie de cause inconnue» dans les premiers jours, aux cas confirmés en laboratoire une fois un virus a été identifié, conformément à la norme actuelle, qui comprend des analyses pulmonaires. C'est un phénomène courant lors des épidémies, a-t-elle déclaré.

Ces problèmes sont exacerbés par le fait que le gouvernement chinois s'est déjà montré disposé à supprimer les informations médicales pour des raisons politiques. Alors que vous espérez que la gravité de la situation aurait changé cet instinct, le fait jette une ombre de doute sur tout ce que nous savons.

Comment le monde devrait-il réagir dans ce brouillard d'incertitude?

Bien que chaque élément d'information soit sujet à révision et à la règle statistique habituelle des ordures entrantes et sortantes , les épidémiologistes ont des moyens de mieux comprendre ce qui se passe.

Des techniques statistiques bien établies peuvent être utilisées pour nettoyer les données en désordre. Une étude réalisée cette semaine par l'Imperial College de Londres a utilisé le filtrage des passagers voyageant vers le Japon et l'Allemagne pour estimer que le taux de mortalité pour tous les cas était d'environ 1% - inférieur aux 2,7% des confirmés trouvés dans la province du Hubei, mais supérieur au 0,5% observé pour le reste du monde.

Lorsque les études de différents chercheurs utilisant différentes techniques commencent à converger vers des conclusions communes, c'est aussi une indication forte, sinon irréprochable, que nous sommes sur la bonne voie. Le nombre de nouvelles infections causées par chaque cas de coronavirus a maintenant été identifié dans la région de 2,2 ou 2,3 par plusieurs études distinctes , par exemple - bien que ce nombre lui-même puisse être sujet à changement au fur et à mesure que les gens se mettent en quarantaine et s'auto-isolent pour prévenir l'infection.

La vérité troublante, cependant, est que dans une société qui s'attend à tout savoir, ce savoir le plus crucial est encore incertain.

Google peut suivre chacun de mes mouvements et me dire où j'ai déjeuné la semaine dernière, mais les virus ne portent pas de téléphones. Les faits concernant cette maladie sont cachés dans l'activité de milliards de particules à l'échelle nanométrique, se propageant à travers les cellules de dizaines de milliers d'humains et les environnements que nous traversons. Les mégadonnées peuvent à peine rayer la surface de la résolution de ce problème.

Plus d'information :

Tag : Données, data, information, santé, virus, coronavirus, japon, wuhan, recherches, sciences, nombre de cas, infectés, décès, fiabilité, , coronavirus, province, Changé, Maladie, Hubei, virus, épidémiologistes, épidémie, information, Chinois, jette, ombre, gravité, brouillard, désordre, Imperial College de Londres, Japon, Allemagne, taux de mortalité, communes, résolution, rayer, mégadonnées, cellules, nanométrique, particules, Google, Vérité, infection, région, gouvernement, courant, décédées, épidémiologie, statistiques médicales, université de Melbourne, épidémiologiques, vulnérabilités, défenses immunitaires, chinoise, Big Data, échantillonnage, pression, Norme, pneumonie, SUD, biosécurité, L'Hôpital, ordre, syndrome,



Avis

Devenez membre pour donner votre avis !

Donner votre avis