Tafra : pourquoi il faut déconfiner les données du HCP

Le centre de recherche Tafra réagit à l’étude du Haut-commissariat au plan (HCP) et appelle au “déconfinement” des données publiques.

Par

Dans une étude intitulée “pandémie Covid-19 dans le contexte national” et publiée le 16 mai 2020, le HCP se livre, comme l’écrit dans son préambule M. Ahmed Lahlimi Alami, Haut-commissaire au plan, à une entreprise qui “pourrait paraître plutôt inédite dans les travaux traditionnels du Haut-commissariat au plan”, dont la mission est d’être le “principal producteur de l’information statistique économique, démographique et sociale et chargé de l’établissement des comptes de la nation”.

L’élaboration de ces scénarios, tient à préciser M. Ahmed Lahlimi Alami, est à prendre “comme un exercice à caractère plutôt méthodologique, voire pédagogique, et ses conclusions comme de simples indicateurs de tendances, utiles pour alerter l’opinion publique, provoquer les chercheurs et éventuellement éclairer les centres de décision, sans prétention ni à une compétence exclusive ni à une exhaustivité thématique ni à une légitimité institutionnelle particulière”. C’est donc avec plaisir que nous nous livrons également à l’exercice, et apportons au débat public notre lecture et nos interrogations sur cette étude.

Les scénarios du HCP

Dans son étude, le HCP confronte quatre grands scénarios : (1) un scénario “d’évolution naturelle”, qui estime la progression de l’épidémie si le Maroc n’avait adopté aucune mesure de prévention, (2) un scénario “tendanciel”, qui présuppose que le Maroc poursuive le confinement actuellement en place, ainsi que deux scénarios intermédiaires, où l’on lève partiellement les restrictions liées au confinement.

Pour établir ces prédictions, le HCP utilise un modèle standard, le modèle SIR (Susceptible, Infected, Recovered or Removed), où l’on divise la population en trois grands “compartiments” : les infectés, qui peuvent contaminer les populations susceptibles et, après un certain temps, sont éliminés (recovered or removed) soit parce qu’ils guérissent, soit parce qu’ils décèdent.

Le modèle dépend d’un nombre clé, le R0, qui mesure le nombre de personnes moyennes qu’infecte une personne malade, et que l’on estime à partir de trois paramètres : le nombre de contacts d’un individu, la probabilité d’être infecté suite à un contact, et la durée de la période infectieuse.

Des paramètres inadaptés au Maroc ?

Notre première série d’interrogations concerne les paramètres utilisés par le HCP. Pour construire le scénario d’évolution naturelle, le HCP utilise les paramètres d’études chinoises. Or certains des paramètres du modèle sont contextuels, c’est-à-dire des paramètres qui ne sont pas biologiques, mais dépendent de la société où a lieu l’épidémie.

Ainsi, dans une société comme la Chine, où les ménages comprennent relativement peu de membres, suite à la politique de l’enfant unique, il est probable que le nombre de contacts d’un individu soit inférieur à celui du Maroc. Si c’était le cas, le HCP sous-estimerait alors la diffusion de l’épidémie. Nous sommes curieux de savoir les raisons pour lesquelles le HCP n’a pas réalisé des estimations des paramètres du scénario d’évolution naturelle basées sur des données marocaines.

De même, pour construire le scénario tendanciel, le HCP dérive ses trois paramètres d’une série d’estimations statistiques basées sur la diffusion de l’épidémie depuis le mois de mars 2020. Comme toute estimation statistique, ces estimations sont accompagnées d’une marge d’erreur, qui est plus grande à mesure que l’échantillon utilisé pour réaliser ces estimations est petit.

D’autre part, à partir des mêmes données, il existe plusieurs méthodes pour estimer ces paramètres, chacune ayant ses avantages et ses inconvénients, et chacune donnant des estimations différentes. La note méthodologique accompagnant l’étude ne détaille malheureusement pas suffisamment la méthode employée pour estimer ces paramètres. En outre, accompagner les prédictions de leur marge d’erreur aurait été souhaitable, afin que les politiques publiques puissent adopter une approche plus conservatrice vis-à-vis de chacun des scénarios présentés.

Un problème de modèle

Ensuite, nous nous interrogeons sur le fait que le modèle utilisé par le HCP ne semble pas adapté aux conclusions dégagées par l’étude. Spécifiquement, (1) les deux scénarios de déconfinement envisagés prévoient de déconfiner les populations les plus jeunes en maintenant les mesures de confinement pour les plus âgés, et (2) le HCP avance des conclusions sur la capacité des hôpitaux à absorber les malades.

Le modèle utilisé considère la population comme homogène. En d’autres termes, le modèle ne fait pas la différence entre les plus jeunes et les plus âgés. De même, le modèle ne fait pas de différence, parmi les personnes éliminées, entre celles qui décèdent et celles qui se rétablissent. Or il a été établi que ces deux populations ont des sociabilités différentes, avec des contacts différents et que la létalité du virus est bien différente pour ces deux populations.

Par ailleurs, le modèle ne considère pas explicitement la charge sur les hôpitaux. Nous sommes curieux de savoir pourquoi le HCP n’a pas choisi d’estimer un modèle avec des compartiments prévoyant des populations différenciées par classes d’âge et des populations hospitalisées, bien que ces modèles soient des extensions bien connues du modèle SIR standard.

Enfin, nous nous interrogeons sur la faisabilité des scénarios intermédiaires évalués par le HCP. Le premier considère un déconfinement de l’ensemble des moins de 65 ans, tandis que le second, plus conservateur, considère, parmi cette population, le seul déconfinement des actifs occupés non atteints d’une maladie chronique. Or dans la société marocaine, plusieurs générations peuvent cohabiter sous un même toit, rendant absolument nécessaire l’intégration de compartiments pour les populations plus âgées et les populations jeunes dans le modèle, et soulevant autant de questions sur la possibilité de ces scénarios.

À ce titre, il aurait été judicieux de considérer des scénarios plus réalistes, incluant le port du masque obligatoire, l’isolation des cas et la quarantaine des contacts.

Pour un déconfinement des données publiques

Au vu de ces questions, il est probable que ce modèle souffre du même type de faiblesses que des modèles similaires estimés pour le Maroc, à savoir un biais important. Le HCP dispose pourtant d’une quantité inestimable de micro-données sur la population marocaine, et le Ministère de la Santé pourrait diffuser un relevé du nombre d’infections à des niveaux plus fins d’agrégation.

Si ces bases de données étaient librement accessibles selon les standards internationaux, la communauté scientifique aurait pu contribuer à accompagner le débat public et la prise de décision politique avec des analyses et des prédictions basées sur des données fiables. Les règles de la production scientifique auraient assuré le contrôle de la qualité de ces modèles, et favorisé une émulation saine entre les chercheurs de différents horizons.

à lire aussi

Dans un communiqué publié récemment, le HCP révèle que, pour l’essentiel, ces données ne sont pas mises à la disposition de la communauté scientifique pour des raisons de protection des données personnelles. Pourtant, vu le coût humain d’erreurs liées à des prédictions trop optimistes, ainsi que le coût économique lié à des prédictions trop pessimistes, il serait peut-être souhaitable que le HCP et le Ministère de la Santé adoptent une approche plus progressiste dans leurs pratiques d’accès aux données, en adoptant par exemple des procédures pour que des chercheurs identifiés puissent y accéder sans attenter à la protection des données personnelles.