samedi 1 juin 2013

La limite de la statistique

En anglais : The limit of statistics

Nous savons que la statistique ne convient pas pour décrire une population de petite taille. On peut certes dénombrer les individus qui la composent mais il sera pratiquement impossible de passer de la description à l'explication.

En effet l'explication exige que l'on trouve dans l'observation statistique des « indices » (au sens qu'a ce mot dans l'enquête d'un détective) qui orienteront vers des hypothèses causales, entre lesquelles il faudra encore trier en s'appuyant sur le cumul des interprétations passées que fournit la théorie.

On trouvera ces « indices » dans la comparaison de la distribution d'un caractère entre des populations différentes (exemple : comparaison de la pyramide des âges entre deux pays ou deux époques du même pays) et dans la corrélation entre des caractères à l'intérieur d'une même population.

On peut extraire dans une population nombreuse un échantillon représentatif, c'est-à-dire tel que les distributions et corrélations observées sur cet échantillon ne soient pas sensiblement différentes de celles que l'on pourrait observer sur la population entière car les « indices » qu'elles fournissent conduisent aux mêmes hypothèses.

Voici donc le critère permettra de dire si une population a une taille suffisante pour qu'il soit possible d'interpréter sa description statistique : il faut qu'elle puisse être considérée comme un échantillon représentatif tiré dans une population virtuelle de taille infinie et dont la structure s'explique par mêmes causalités que la population considérée.

*     *

Certaines populations ne sont donc pas « statistisables », que l'on pardonne ce néologisme. On peut certes les dénombrer, calculer sur elles des totaux, moyennes, dispersions et corrélations puis publier tout cela dans des tableaux et des graphiques : mais il sera impossible d'interpréter ce fatras, de passer de cette description à une explication.

C'est le cas, par exemple, de beaucoup de statistiques sur les entreprises : il arrive souvent que la production d'une branche ou d'un secteur soit concentrée dans quelques grandes entreprises dont le nombre est trop faible pour que cette population soit « statistisable ».

Il reste un recours : quand il est impossible d'interpréter la statistique, on peut toujours utiliser la monographie. La recherche des causalités qui sont à l’œuvre dans la population considérée ne passera plus alors par l'examen des distributions et des corrélations, mais par celui de cas individuels considérés chacun dans son histoire particulière.

Certes, l'histoire ne procure jamais que des hypothèses car le passé est essentiellement énigmatique : mais après tout la statistique, elle aussi, ne fournit dans le meilleur des cas que des hypothèses... Mais elles ne sont pas de même nature, et la monographie exige une profondeur d'enquête dont la statistique dispense.

Aucun commentaire:

Publier un commentaire