samedi 27 février 2016

L'illusion de la start-up

« Startups are a wonderful thing, but they cannot by themselves increase tech employment. Equally important is what comes after that mythical moment of creation in the garage, as technology goes from prototype to mass production. This is the phase where companies scale up. They work out design details, figure out how to make things affordably, build factories, and hire people by the thousands. Scaling is hard work but necessary to make innovation matter. » (Andy Grove, « How America Can Create Jobs », Bloomberg Business, 1er juillet 2010)

Les start-ups occupent une grande place dans le discours sur le « numérique ». Innovantes, agiles, elles font des choses merveilleuses et amorcent une économie nouvelle, coopérative, qui ne sera plus celle des grandes entreprises...

Etant à taille humaine elles éveillent une tendresse chez ceux, nombreux, qui détestent ce qui est institutionnel, organisé, sérieux, etc. Elles bricolent dans un garage, confectionnent des solutions ingénieuses à partir de presque rien : des produits de série pas chers, des logiciels open source gratuits qu'elles assemblent en bricolant...

Le « data center » d'une start-up en 1998 n'était-il pas un de ces bricolages ?



C'est aussi mignon qu'un bébé panda, n'est-ce pas ? La start-up en question, c'est Google...

Voyons donc cela de plus près.

samedi 13 février 2016

Connaître le monde des données

« The basic dissimilarities between human languages and computer languages may be the most serious obstacle to a true symbiosis »
(Joseph Licklider, Man-Computer Symbiosis, 1960).

Ce que l'on appelle « données », c'est la masse de documents de toute nature et de tableaux de nombres à laquelle l'intellect est confronté et dont il s'efforce de tirer quelque chose de compréhensible.

Les statisticiens et les comptables publient en abondance des tableaux de nombres comme s'ils ignoraient un fait évident : personne ne lit les tableaux de nombres car ils sont incompréhensibles.

Personne, en effet, ne peut quoique l'on puisse dire comprendre à la simple lecture ce que contient un tableau de nombres comportant plus de dix lignes et dix colonnes. L'exploration de ce tableau demandera quelques heures de travail à un analyste bien outillé, et il lui faudra encore du travail pour interpréter ce que l'exploration a dégagé1.

Il est d'ailleurs très difficile de produire, à partir de la masse des données relatives à une question quelconque, la synthèse simple, claire et lisible qui apportera vraiment à son lecteur une information sur cette question. Comme la lecture d'une telle synthèse est facile et peut même être agréable, le lecteur croira souvent qu'il a été facile et agréable de la rédiger. C'est pourquoi des économistes, statisticiens et comptables préfèrent publier de gros tableaux de nombres accompagnés de commentaires sibyllins : personne ne pourra rien y comprendre mais leur travail sera jugé sérieux.

La façon dont les réputations se forment dans les institutions pèse ainsi sur le monde des données, qui se trouve soumis encore à d'autres contraintes sociologiques.

*     *

On croit généralement que les données sont quelque chose de simple que l'on peut manier comme s'il s'agissait d'un minerai homogène : « Ben quoi, entend-on dire, les données c'est les données, voilà tout ». En fait toute donnée est un être composite et plus compliqué qu'on ne le croit communément.

Une donnée est en effet le couple logique formé par un concept et une mesure, le concept étant lui-même le couple, désigné par un mot, d'une idée et d'une définition.

Une donnée n'est donc pas « donnée » par la nature : le concept a été choisi, la mesure a été obtenue.