mercredi 13 mai 2009

Critique de la raison statistique

Il ne s'agit pas ici de "critiquer la statistique", de la dénigrer - c'est ce que font des ignorants avec une obstination écoeurante - mais de délimiter sa portée légitime et son apport exact.

Le but de la statistique est qualitatif

Que retenons-nous après avoir consulté des statistiques ? Qu'en reste-t-il dans notre mémoire, qu'avons-nous appris ?
- des ordres de grandeur ("la population de la France (métropolitaine) est d'environ 62 millions de personnes"),
- des comparaisons ("l'Allemagne est plus peuplée que la France"),
- des évolutions ("la distribution des revenus est devenue plus inégalitaire depuis vingt ans"),
- des impressions ("l'inflation est faible en ce moment").

La statistique nous alimente ainsi en idées, en impressions qualitatives. Quand elles sont quantitatives ("la France est peuplée d'environ 62 millions de personnes") ces idées se satisfont d'un ordre de grandeur qui, même s'il mentionne une quantité, procure une impression qualitative. Les nombres informent d'ailleurs moins par eux-mêmes que par comparaison dans le temps ou dans l'espace : les "62 millions" de la France d'aujourd'hui ne prennent un sens que si on les compare aux "45 millions" de 1960 ou aux "82 millions" de l'Allemagne.

Ainsi tandis que la statistique est quantitative dans son expression elle sert un but qualitatif. La précision n'est donc pas la première qualité que l'on doive exiger d'elle (sauf quand elle est destinée à évaluer une différence ou un solde, car il faut alors une précision suffisante). Il faut surtout qu'elle soit exacte en ce sens que les impressions, les idées qu'elle suggère correspondent aux faits et qu'elles soient susceptibles d'alimenter, sur les choses que la statistique observe, un raisonnement lui-même exact.

Parfois la précision est trompeuse : mesurer la taille d'une personne à un micron près, cela donnerait une impression fausse sur le corps humain qui, étant élastique, ne peut pas se mesurer avec une telle précision. De même, mesurer à une unité près la population d'un pays un jour donné, cela donne une impression fausse (car dans le cours d'une même journée des naissances et des décès se produisent et l'effectif de la population change - et surtout un recensement exhaustif comporte une marge d'erreur de l'ordre de 1 %). Certes on a raison de publier ainsi le résultat d'un recensement, cela permet de vérifier les additions. Mais il ne faut pas être dupe de la précision et seul importe l'ordre de grandeur que l'on retiendra.

Il n'est pas exclu, bien sûr, que certaines statistiques aient pour but de donner une impression fausse : comme toute information la statistique est manipulable et il faut savoir déceler les tromperies. Cela demande un peu d'habileté - mais ceux qui prétendent que la statistique n'est qu'une forme de mensonge se trompent, à moins qu'ils ne mentent eux-mêmes.

De la description à l'explication


Toute statistique décrit un ensemble fini [1], ou "population", que l'on a choisi d'observer et qui est formée d'êtres (que l'on nomme "individus") différents mais semblables sous un certain rapport : la population humaine d'un pays (la démographie est la plus ancienne application de la statistique), ou bien la population des entreprises d'une région, des tableaux d'un musée, des livres publiés durant une même année etc.

La statistique observe, mesure, classe, dénombre et calcule. Elle observe, sur chacun des individus de la population considérée, les attributs (ou "variables") que l'on a choisi de retenir : elle mesure les attributs quantitatifs, elle classe les individus selon les attributs qualitatifs et dénombre ceux qui appartiennent aux diverses classes ; elle calcule des fréquences, totaux, moyennes et corrélations ; elle présente enfin ses résultats sous la forme de tableaux et de graphiques.

L'opération statistique est une observation, son résultat est une description. Mais une description ne se suffit pas à elle-même, d'abord parce qu'elle a toujours pour origine une intention : on n'observe que les choses que l'on a jugé utile d'observer, on ignore les autres ; ensuite parce que la description appelle toujours son dépassement. Une fois que l'on a décrit une chose, on veut en effet comprendre pourquoi cette chose est ce qu'elle est, pourquoi elle est comme elle est. Toute description appelle une explication.

Mais pour expliquer il faut sortir de la description, et donc de la statistique, pour évoquer des causalités. La statistique mesure des corrélations qui mettent sur la piste des causalités, non sans quelques risques que nous examinons dans "Critique de la raison corrélative".

Objectivité et pertinence


A moins d'être un maniaque de la statistique (il en existe !) on n'observe pas pour le plaisir : on n'observe que les choses envers lesquelles on a une intention. Que cette intention soit individuelle ou collective, elle vise toujours une action, fût-ce après un délai qui peut être long.

Ainsi, et alors même que l'observation est loyale ou, comme on dit, "objective" et fournit une information authentique sur la population observée, l'appareil statistique est orienté d'une façon subjective, fût-ce de la subjectivité collective qui est celle d'une nation.

Cette orientation sera pertinente si les données qu'elle fournit alimente efficacement l'action du sujet (individuel ou collectif) qui observe, si elle éclaire les obstacles qu'il rencontre et les outils dont il peut s'emparer pour agir.

Les critères de qualité s'appliquent ainsi à la statistique selon un ordre :
- l'orientation de l'appareil d'observation, la définition des êtres et des attributs à observer doit être pertinente en regard de l'intention, de l'action envisagée ;
- l'observation doit être exacte, c'est-à-dire nourrir des impressions qui puissent favoriser la justesse de l'action.

Limites du domaine d'application de de la statistique


Il est matériellement et pratiquement possible de soumettre à l'observation statistique n'importe quelle population. Mais les résultats ne seront interprétables que si l'on peut considérer cette population comme un échantillon représentatif d'une population virtuelle infinie - ou, ce qui revient au même, si l'on peut tirer dans cette population divers échantillons dont l'observation fournisse des résultats, des ordres de grandeur, qualitativement analogues.

En effet ce que l'on observe dans une population, ce sont des moyennes, des dispersions, des corrélations ; or ces résultats ne seront interprétables que si la population est assez nombreuse.
Il existe ainsi des populations qui ne se prêtent pas à la statistique : dans certains secteurs d'activité, par exemple, la population des entreprises de plus de mille salariés est d'effectif trop faible pour que l'on puisse l'étudier par la statistique.

Cela ne veut pas dire qu'il soit totalement inutile de connaître leur nombre, leur effectif salarié total ou moyen etc. Cependant les indicateurs que l'on obtient ainsi constituent un fait brut, exact sans doute mais qui ne se prête ni au raisonnement ni à l'interprétation : on peut l'énoncer, mais non pas le commenter.

Il ne suffit donc pas d'avoir observé, dénombré, mesuré etc. pour produire une statistique interprétable : il faut aussi que celle-ci porte sur une population "statistisable", si l'on autorise ce néologisme.

Statistique et monographie


L'observation considère les individus de l'extérieur quand elle mesure ou qualifie leurs attributs. Le fonctionnement intime, organique, de ces individus lui échappe.

Ainsi la statistique des entreprises relève, sur chaque entreprise observée, plusieurs données : effectif salarié par qualification et par établissement, chiffre d'affaires par produit, consommations intermédiaires, compte d'exploitation, bilan etc. ; mais elle n'examine pas la façon dont une entreprise fonctionne, s'organise, se positionne, comment les diverses parties de son organisation coopèrent.

Un tel examen, c'est la tâche de la monographie qui, considérant un seul individu, peut l'ouvrir pour regarder ses organes et considérer leurs relations comme on le fait lorsqu'on dissèque un animal ou une plante.

La monographie est complémentaire de la statistique. Elle la précède utilement, car il est nécessaire de comprendre comment fonctionnent, comment vivent, les êtres que l'on souhaite observer : cette compréhension éclaire le choix des attributs à observer.

Elle la complète aussi : si une population n'est pas "statistisable" (cas des grandes entreprises d'un secteur), l'étude monographique des individus qui la composent permet de suppléer, dans une certaine mesure, à l'impossibilité de la statistique.

(Voir Critique de la raison corrélative)
__________
[1] Il arrive que l'on fasse un sondage sur un ensemble continu (surface agricole, volume de l'air), mais cet ensemble est alors divisé en fait en unités discrètes (parcelles agricoles, cellules météorologiques).

8 commentaires:

  1. Bonjour,

    je n'arrive pas à comprendre la partie sur la population virtuelle. Par exemple la statistique des décès sur la route, étudiée dans le temps ou par raison de l'accident ne me semble pas relever de ce principe. Mais il existe peut-être une formule enseignée dans les écoles qui dit le contraire.

    Le passage sur statistique et monographie est essentiel est mérite d'être connu.

    RépondreSupprimer
  2. @Anonyme
    Toute population concrète, réelle, est de taille finie. On peut toujours la dénombrer, calculer sur elle des moyennes etc. ; mais les indicateurs n'ont de signification statistique que si la taille de cette population est suffisante pour qu'on puisse la considérer comme un échantillon représentatif tiré dans une population de même structure et de taille infinie - laquelle n'existe pas, c'est pour cela que je la qualifie de "virtuelle".
    J'ai compris cela en faisant de la statistique sur les entreprises : souvent la taille de la population est trop faible pour que l'on puisse la représenter convenablement par la statistique et décrire son évolution.
    Dans ce cas, mieux vaut renoncer à l'approche statistique et faire des monographies.

    RépondreSupprimer
  3. Excellent ! je crois que j'ai tout compris. Comment faire le pas d'après sur les principaux enseignements de la statistique (grands indicateurs et principales méthodes). J'ai feuilleté de nombreux livres sur le domaine mais la plupart sont remplis de formules et n'expliquent pas grand chose. Pouvez-vous me conseiller ?

    RépondreSupprimer
  4. @Anonyme
    Vous pourrez trouver des indications utiles (et sans embarras mathématiques superflus) dans Le métier de statisticien (le texte intégral de cet ouvrage est accessible en ligne).

    RépondreSupprimer
  5. Merci pour votre réponse, ça correspond effectivement. En parcourant votre autre site je suis également tombé sur une page "La statistique" très complète. Peut-être pourriez vous intégrer certaines passerelles de ce type dans votre nouveau site ?

    RépondreSupprimer
  6. @Anonyme
    Je mets dans ce blog des passerelles vers volle.com, mais sans doute pas assez. Je vais m'y appliquer : merci pour votre remarque.
    D'après Google volle.com contient 123 pages où se rencontre l'expression "la statistique"...

    RépondreSupprimer
  7. Bonjour
    Je suis tombé sur ce blog parce que je viens de lire "statistics the Achilles heel of Government". cliquer .
    Cordialement.

    RépondreSupprimer
    Réponses
    1. Ce texte est représentatif de l'hostilité des néolibéraux envers la statistique : ils postulent l'optimalité d'une libre interaction des individus sur le marché et estiment qu'il vaut mieux ne pas l'observer car cela permettrait à l’État d'agir.
      Je crois, contrairement à eux, que la qualité de la statistique (et de son interprétation) est, avec le soin apporté au classement des archives, un indicateur du degré qu'atteint une civilisation.

      Supprimer