lundi 24 mai 2021

Deux questions à propos des données

Je me suis posé les questions suivantes :
- comment trouver des données pertinentes dans le bric-à-brac qu'a créé l'informatisation ?
- quelle est la nature du savoir qu'il faut posséder pour interpréter des données ? Comment l'acquérir ?
- les réponses invitent à considérer la fonction pratique de la théorie.

Le bric-à-brac de l’informatisation

Les données étaient rares avant l’informatisation. Pour les produire il fallait le vouloir : faire une enquête, l’exploiter, publier ses résultats demandait du travail et un délai.

S’étant étendue à toutes les actions (étapes du processus de production, démarches des clients et utilisateurs, etc.), l’informatisation enregistre désormais dans la mémoire informatique des traces semblables aux empreintes que les animaux laissent sur le sol : ce sont autant de données qui s’offrent à l’observation sans que personne n'ait voulu les produire.

Leur abondance suscite l’émerveillement : « c’est une richesse ! », « c’est de l’or ! », entend-on dire. C’est plutôt un bric-à-brac semblable au marché aux puces : comment trouver, dans cette accumulation disparate, les données pertinentes dont on pourra tirer un enseignement utile ?

Si nous allons au marché aux puces sans rien chercher de précis il est probable que nous n’y trouverons rien d’intéressant. Si par contre nous savons ce que nous voulons – « il me faut quatre verres à pied », « je voudrais une table de nuit », etc. – alors nous avons une chance d’y trouver ce qui nous convient.

Il en est de même avec les données : si nous n’avons aucun besoin, ne nous posons aucune question, leur bric-à-brac ne nous apportera sans doute rien. Si par contre nous nous posons une question précise, nous y trouverons peut-être des données éclairantes : la « richesse » des données ne peut se manifester qu’en réponse à une interrogation.

Au fronton d’une mémoire informatique on peut placer les vers que Paul Valéry a inscrits sur le palais de Chaillot :

Il dépend de celui qui passe
Que je sois tombe ou trésor
Que je parle ou me taise
Ceci ne tient qu’à toi
Ami n’entre pas sans désir

Comment interpréter les données

Les données nous apportent des totaux, moyennes et corrélations (et aussi, avec les séries chronologiques, des tendances qui résultent d'une corrélation avec le temps).

Nous pouvons vérifier si les données sont « significatives », c’est-à-dire différentes ce que donnerait un tirage au sort, mais cela ne nous donne pas l’explication des phénomènes qu'elles reflètent.

Interpréter les données, c’est répondre aux questions que suscite leur examen en trouvant une explication des faits saillants les plus significatifs que font apparaître les graphiques et les tableaux de nombres.

Or la statistique ne contient pas cette explication. Une corrélation signale une relation entre deux données mais il faut faire un tri car on connaît des exemples de corrélations dues au hasard1 : pour les éliminer notre pensée doit posséder le savoir logique, la grille conceptuelle qui distingue et sépare les êtres réels.

Quelle est d’ailleurs la portée de l’analogie qu’une corrélation révèle ? Si A et B sont corrélées, rien n’indique si A est cause de B, B cause de A, ou encore si A et B sont toutes deux causées par C : pour trancher cela il faut disposer d’hypothèses sur la causalité.

Une grille conceptuelle associée à des hypothèses causales forme une théorie. Pour pouvoir interpréter des données, il donc faut posséder une théorie du phénomène qu’elles reflètent. Mais quel genre de théorie ?

Pragmatisme de la théorie

L’école nous a inculqué une conception académique de la théorie : elle serait l’affaire des Savants, des Scientifiques, et éloignée de l’action…

Pourtant chacune de nos actions implique une théorie. Apprendre à conduire une voiture, par exemple, c’est acquérir la grille conceptuelle qui fera abstraction, dans l’image qui s’affiche sur la rétine, des éléments qui distrairaient de la conduite ; c’est acquérir aussi le schéma de causalité qui permettra d’anticiper le résultat d’une action (freiner, tourner le volant, etc.).

Cette théorie n’est certes pas enseignée de façon théorique : l’instructeur cherche plutôt à familiariser l’élève avec la voiture, à lui inculquer des réflexes, etc. Il en est de même pour la théorie dont nous avons besoin pour interpréter des données : elle s’acquiert par une expérience familière de la réalité que les données reflètent, du terrain dont elles proviennent. On ne peut pas interpréter des données si l’on ignore de quoi il s’agit.

De façon générale, toute action professionnelle, technique, suppose des concepts, des causalités, et donc une théorie : le chirurgien, le maçon, etc., connaissent le nom et la fonction de leurs outils, ils savent anticiper les effets de leurs gestes. Le fait qu’ils aient incorporé cette théorie dans leurs réflexes ne change en rien sa nature essentiellement logique.

Il en est de même des théories que l’enseignement académique revêt d’un formalisme. La théorie économique, par exemple, s’est construite par une accumulation d’expériences et de réflexions qui ont sélectionné des concepts et des schémas de causalité : celui qui l’ignore fera, lorsqu’il interprète des données, des erreurs naïves que les théoriciens ont appris à éviter.

Il convient cependant d’avoir avec cette théorie, comme avec toutes les autres théories académiques, une relation familière et pratique et non la déférence paralysante qui, croit-on, s'impose devant l’œuvre des Grands Savants : toute théorie ayant été conçue pour éclairer l’action dans une situation historique particulière, il faut oser la transposer afin d’éclairer la situation qui est aujourd'hui la nôtre.

Voir aussi :
Qu'est-ce que la qualité des données ?
Place des données dans l'iconomie

____

1 « Le nombre des personnes qui se tuent en s’emmêlant dans leurs draps de lit est corrélé avec la consommation de fromage », « le taux de divorces dans le Maine est corrélé avec la consommation de margarine », etc. (Spurious correlations).

1 commentaire:

  1. c'est bien dit, c'est clair et net !!
    bravo Michel pour ce rappel de bon sens !!
    merci
    olivier piuzzi

    RépondreSupprimer