Envoyer à un ami | Version à imprimer | Version en PDF

Prévenir les tragédies statistiques

par Pinelopi Koujianou Goldberg*

NEW HAVEN - Dans un article paru en juillet 2020 dans la revue spécialisée Brookings Papers on Economic Activity, Tristan Reed et moi-même avions démontré que contrairement aux attentes, les décès par habitant dus au Covid-19 était bien moins nombreux dans les pays pauvres que dans les pays riches. Les lecteurs ont immédiatement objecté que ce résultat devait être du à des erreurs de mesure ou à un manque de données pour ces pays. Alors que notre observation a depuis résisté à l'examen et à l'épreuve du temps, la réaction initiale était révélatrice : les statistiques provenant des pays en développement suscitent souvent la méfiance (quand elles ne sont pas purement et simplement rejetées).

Ce préjugé est-il justifié ? Dans un article récemment publié dans le Journal of Economic Perspectives, « Pourquoi la croissance des pays en développement est-elle si difficile à mesurer ? », mes co-auteurs et moi-même estimons qu'il ne l'est pas. En dépit de rares cas hautement médiatisés de manipulation des données, les prévisions de croissance des pays en développement sont en moyenne tout aussi fiables que celles des économies avancées.

Certes, il n'existe pas d'indicateur unique, clairement défini, pour évaluer la qualité des prévisions de croissance d'un pays. Toutefois, l'approche traditionnelle en économie consiste à examiner les corrélations entre des estimations obtenues à partir de différentes sources de données. En utilisant cette méthode, nous avons comparé les prévisions basées sur trois sources distinctes : le Système de comptabilité nationale (SCN), les données d'enquêtes sur les ménages et les données satellite récemment devenues disponibles (principalement basées sur les émissions lumineuses nocturnes et parfois sur la végétation).

De telles comparaisons permettent d'établir que les différences entre les taux de croissance moyens à partir de ces trois sources de données sont faibles, généralement de l'ordre de 1,5 point de pourcentage ou moins. Si des écarts de cette amplitude peuvent être considérés comme importants dans les pays à revenu élevé (dont les taux de croissance annuels se situent dernièrement autour de 3-4%), ils sont relativement modestes pour de nombreux pays en développement à croissance rapide. Une marge d'erreur moyenne de quelques 1,5 point de pourcentage ne semble pas prêter à conséquence au vu des incertitudes concernant ces estimations.

En outre, une nouvelle base de données établie par le Fonds monétaire international et la Banque mondiale ne présente aucune indication que les données des SCN des pays à faible revenu soient systématiquement manipulées à des fins politiques. Il est intéressant de noter que ce sont les pays à revenu intermédiaire qui semblent poser le plus de problèmes, laissant à penser que la manipulation des données pour des motifs politiques est plus réalisable à partir d'un certain seuil de sophistication et de capacité statistiques. Dans une certaine mesure, ces résultats incitent à l'optimisme parce qu'ils indiquent que les statistiques produites dans les pays en développement sont effectivement significatives et qu'il serait mal avisé de les rejeter d'emblée.

Il n'en reste pas moins que les pays pauvres pourraient de toute évidence bénéficier d'une meilleure capacité statistique. Comme l'a expliqué Shanta Devarajan de la Banque mondiale dans un article influent de 2013, les pays à faible revenu, en Afrique en particulier, sont victimes d'une « tragédie statistique ». En raison d'un manque de ressources pour la collecte, la gestion et la diffusion des données, et d'une absence de coordination entre les agences et les parties prenantes concernées, les décideurs politiques de nombreux pays à faible revenu doivent se contenter d'utiliser des données anciennes et des méthodes dépassées.

En fait, plusieurs cas hautement médiatisés de prévisions de croissance manquant de fiabilité ont davantage été le résultat de méthodes obsolètes que de manipulation à des fins politiques. Et même dans ces cas, les autorités locales semblent avoir réalisé un travail miraculeux en fournissant des chiffres relativement fiables, au vu des contraintes qui sont les leurs.

La question qui se pose est de savoir comment les pays en développement peuvent améliorer leurs capacités statistiques. Ce qui est bien entendu plus facile à dire qu'à faire. Comme mes co-auteurs et moi-même l'expliquons dans l'article du Journal of Economic Perspectives :

« Les efforts engagés au niveau international pour soutenir les bureaux nationaux de statistiques sont souvent axés sur des activités ponctuelles de collecte de données, avec une attention limitée portée au renforcement des compétences et des connaissances des statisticiens nationaux ou au développement de systèmes de données. La collecte de données est une tâche relativement bien définie avec une date de fin précise qui se termine généralement par un rapport d'achèvement. Par contre, les investissements visant à améliorer la capacité statistique sont bien plus difficiles à suivre, moins sûrs de réussir, ils sont chronophages et les résultats escomptés sont souvent mal définis ».

Compte tenu des coûts élevés et des incertitudes liés à ces investissements, il est peu probable qu'ils soient réalisés à un moment où les gouvernements subissent déjà la pression fiscale liée à la crise sanitaire du Convid-19.

Il existe heureusement une approche plus réalisable : tirer parti de la technologie et utiliser les nouvelles sources de données (associées aux sources traditionnelles) pour atténuer les contraintes budgétaires. Un boom de nouvelles données accessibles au public - via les programmes d'extraction du contenu de sites web (web scraping), les recherches Google, les transactions numériques, les métadonnées des téléphones mobiles, l'utilisation des médias sociaux et les données satellite - a permis aux chercheurs d'évaluer à moindre coût des variables économiques importants.

Ces sources de données se sont avérées particulièrement utiles pendant la pandémie, permettant aux économistes d'obtenir des informations indispensables sur la pauvreté, l'inflation, les perspectives des entreprises et le bien-être des populations, le tout en temps réel. Et comme ces données peuvent être obtenues plus rapidement et à un coût bien moindre qu'avec les méthodes traditionnelles (telles que les enquêtes en personne de type porte-à-porte), elles sont porteuse d'espoir pour les pays en développement qui manquent de ressources.

Ces nouvelles données ont toutefois des limitations. Bien que les sources de données traditionnelles cherchent à donner une vue d'ensemble de la population concernée, les nouvelles données tendent à pâtir de problèmes de sélection. Bien qu'elles puissent fournir des échantillons à grande échelle et en temps opportun, elles sont rarement représentatives de la population d'un pays. Il est préférable de les utiliser pour compléter, et non remplacer, les données traditionnelles.

Il pourrait sembler naïf de préconiser une amélioration des données au beau milieu d'une pandémie, alors que de nombreux pays à faible revenu ne sont pas encore parvenus à obtenir les vaccins susceptibles de sauver la vie de leurs citoyens. Pourtant, l'un des plus grands risques de la pandémie est qu'elle fasse négliger ou reporter indéfiniment d'importants programmes de développement. Tout comme les responsables politiques doivent insister sur des mesures supplémentaires pour renforcer l'autonomie des femmes et accroître les investissements dans le capital humain, ils doivent s'efforcer de développer les capacités statistiques. Nous ne pouvons pas améliorer ce que nous ne pouvons pas mesurer.



*Ancienne économiste en chef du groupe de la Banque mondiale et éditrice en chef du American Economic Review, est professeur d'économie à l'université Yale.