« The basic dissimilarities between human languages and computer languages may be the most serious obstacle to a true symbiosis »
(Joseph Licklider, Man-Computer Symbiosis, 1960).
(Joseph Licklider, Man-Computer Symbiosis, 1960).
Ce que l'on appelle « données », c'est la masse de documents de toute nature et de tableaux de nombres à laquelle l'intellect est confronté et dont il s'efforce de tirer quelque chose de compréhensible.
Les statisticiens et les comptables publient en abondance des tableaux de nombres comme s'ils ignoraient un fait évident : personne ne lit les tableaux de nombres car ils sont incompréhensibles.
Personne, en effet, ne peut quoique l'on puisse dire comprendre à la simple lecture ce que contient un tableau de nombres comportant plus de dix lignes et dix colonnes. L'exploration de ce tableau demandera quelques heures de travail à un analyste bien outillé, et il lui faudra encore du travail pour interpréter ce que l'exploration a dégagé1.
Il est d'ailleurs très difficile de produire, à partir de la masse des données relatives à une question quelconque, la synthèse simple, claire et lisible qui apportera vraiment à son lecteur une information sur cette question. Comme la lecture d'une telle synthèse est facile et peut même être agréable, le lecteur croira souvent qu'il a été facile et agréable de la rédiger. C'est pourquoi des économistes, statisticiens et comptables préfèrent publier de gros tableaux de nombres accompagnés de commentaires sibyllins : personne ne pourra rien y comprendre mais leur travail sera jugé sérieux.
La façon dont les réputations se forment dans les institutions pèse ainsi sur le monde des données, qui se trouve soumis encore à d'autres contraintes sociologiques.
* *
On croit généralement que les données sont quelque chose de simple que l'on peut manier comme s'il s'agissait d'un minerai homogène : « Ben quoi, entend-on dire, les données c'est les données, voilà tout ». En fait toute donnée est un être composite et plus compliqué qu'on ne le croit communément.
Une donnée est en effet le couple logique formé par un concept et une mesure, le concept étant lui-même le couple, désigné par un mot, d'une idée et d'une définition.
Une donnée n'est donc pas « donnée » par la nature : le concept a été choisi, la mesure a été obtenue.