5 choses que les “ experts ” autoproclamés du COVID-19 se trompent sur les statistiques

Si nous n’analysons pas les statistiques de la vie, il est facile de se laisser prendre par la désinformation sur les statistiques du COVID-19 sur les réseaux sociaux, surtout si nous n’avons pas le bon contexte.
Par exemple, nous pouvons choisir des statistiques qui soutiennent notre point de vue et ignorer les statistiques montrant que nous nous trompons. Nous devons également encore interpréter correctement ces statistiques.
Il est facile pour nous de partager cette désinformation. Beaucoup de ces statistiques sont également interdépendantes, de sorte que les malentendus peuvent rapidement se multiplier.
Voici comment éviter cinq erreurs courantes et impressionner vos amis et votre famille en obtenant de bonnes statistiques.
1. C’est le taux d’infection qui fait peur, pas le taux de mortalité
Publications sur les réseaux sociaux comparer COVID-19 à d’autres causes de décès, telles que la grippe, impliquent COVID-19 n’est pas vraiment si mortel.
Mais ces messages manquent la contagiosité du COVID-19. Pour cela, nous devons regarder le taux de mortalité par infection (IFR) – le nombre de décès par COVID-19 divisé par tous ceux infectés (un nombre que nous ne pouvons estimer qu’à ce stade, voir également le point 3 ci-dessous).
Tandis que le le jury est toujours absent, COVID-19 a un IFR plus élevé que la grippe. Messages impliquant un IFR faible pour le COVID-19 le sous-estime certainement. Ils manquent également deux autres points.
Premièrement, si nous comparons les IFR typique de la grippe de 0,1% avec le estimation COVID-19 la plus optimiste de 0,25%, alors le COVID-19 reste plus de deux fois plus mortel que la grippe.
Deuxièmement, et plus important encore, nous devons examiner le nombre de reproduction de base (R₀) pour chaque virus. Il s’agit du nombre de personnes supplémentaires qu’une personne infectée est censée infecter.
Grippe R₀ est d’environ 1,3. Bien que les estimations du COVID-19 varient, son R₀ se situe autour d’un médiane de 2,8. En raison de la croissance exponentielle des infections (voir ci-dessous), le saut de 1,3 à 2,8 signifie que le COVID-19 est beaucoup plus infectieux que la grippe.
Lorsque vous combinez toutes ces statistiques, vous pouvez voir la motivation derrière nos mesures de santé publique pour «limiter la propagation». Ce n’est pas seulement que COVID-19 est si mortel, mais c’est aussi mortel et très contagieux.
2. Croissance exponentielle et graphiques trompeurs
Un graphique simple peut tracer le nombre de nouveaux cas COVID au fil du temps. Mais comme les nouveaux cas peuvent être signalés de manière erratique, les statisticiens s’intéressent davantage au taux de croissance du nombre total de cas au fil du temps. Plus la pente ascendante du graphique est raide, plus nous devons nous inquiéter.
Pour COVID-19, les statisticiens cherchent à suivre croissance exponentielle dans les cas. En termes simples, les cas de COVID non restreints peuvent entraîner un nombre croissant de cas supplémentaires. Cela nous donne un graphique qui suit lentement au début, mais qui se courbe ensuite fortement vers le haut avec le temps. C’est la courbe que nous voulons aplatir, comme indiqué ci-dessous.
Cependant, les publications sur les réseaux sociaux comparent régulièrement les chiffres du COVID-19 avec ceux d’autres causes de décès qui montrent:
Même lorsque les chercheurs parlent de croissance exponentielle, ils peuvent toujours induire en erreur.
Un professeur israélien largement partagé L’analyse a affirmé que la croissance exponentielle du COVID-19 «s’estompe après huit semaines». Eh bien, il avait clairement tort. Mais pourquoi?
Son modèle supposait que les cas de COVID-19 croissaient de façon exponentielle sur un certain nombre de jours, au lieu d’une succession de transmissions, chacune pouvant prendre plusieurs jours. Cela l’a amené à ne tracer que la croissance erratique de la phase précoce de l’épidémie.
De meilleures visualisations tronquent ces premiers cas erratiques, par exemple en partant du 100e cas. Ou ils utilisent des estimations du nombre de jours nécessaires pour le nombre de cas doubler (environ six à sept jours).
3. Toutes les infections ne sont pas des cas
Ensuite, il y a la confusion entre les infections au COVID-19 et les cas. En termes épidémiologiques, un «cas» est une personne qui reçoit un diagnostic de COVID-19, principalement par un résultat de test positif.
Mais il y a beaucoup plus d’infections que de cas. Certaines infections ne présentent pas de symptômes, certains symptômes sont si mineurs que les gens pensent que c’est juste un rhume, les tests ne sont pas toujours disponibles pour tous ceux qui en ont besoin, et les tests ne détecte pas toutes les infections.
Les infections «provoquent» des cas, les tests découvrent les cas. Le président américain Donald Trump était proche de la vérité quand il a dit le nombre de cas aux États-Unis était élevé en raison du taux élevé de tests. Mais il et d’autres je l’ai encore totalement faux.
Plus de tests ne résultat dans la plupart des cas, il permet un estimation plus précise du vrai nombre de cas.
La meilleure stratégie, épidémiologiquement, n’est pas de tester moins, mais de tester aussi largement que possible, en minimisant l’écart entre les cas et les infections globales.
4. Nous ne pouvons pas comparer les décès avec les cas de la même date
Les estimations varient, mais le temps entre l’infection et la mort pourrait être autant un mois. Et la variation de temps de récupération est encore plus grand. Certaines personnes tombent vraiment malades et mettent beaucoup de temps à se rétablir, d’autres ne présentent aucun symptôme.
Ainsi, les décès enregistrés à une date donnée reflètent les décès de cas enregistrés plusieurs semaines auparavant, lorsque le nombre de cas peut avoir été moins de la moitié le nombre de cas en cours.
Le temps de doublement rapide des cas et le temps de récupération prolongé créent également un écart important entre le nombre de cas actifs et guéris. Nous ne connaîtrons les vrais chiffres que rétrospectivement.
5. Oui, les données sont désordonnées, incomplètes et peuvent changer
Certains utilisateurs de médias sociaux se mettre en colère quand le les statistiques sont ajustées, ravitaillement théories du complot.
Mais peu réalisent comment mammouth, chaotique, et complexe la tâche consiste à suivre les statistiques sur une maladie comme celle-ci.
Les pays et même les États peuvent compter les cas et les décès différemment. La collecte des données prend également du temps, ce qui signifie que des ajustements rétrospectifs sont effectués.
Nous ne connaîtrons les vrais chiffres de cette pandémie que rétrospectivement. De même, les premiers modèles n’étaient pas nécessairement faux parce que les modélisateurs étaient trompeurs, mais parce qu’ils n’avaient pas suffisamment de données pour travailler.
Bienvenue dans le monde de la gestion des données, du nettoyage des données et de la modélisation des données, ce que de nombreux statisticiens en herbe n’apprécient pas toujours. Jusqu’à maintenant.
Cet article est republié à partir de La conversation par Jacques Raubenheimer, Chercheur principal, biostatistique, Université de Sydney sous une licence Creative Commons. Lis le article original.