Chacune de ces opérations consiste en un classement : un visage est classé sous l'identité d'une personne ; un message est classé dans le dossier des spams ; une parole vocale est classée sous un mot écrit ; le prochain coup, aux échecs, est classé comme « meilleur coup possible », etc.
Il faut, pour pouvoir classer un être, disposer a priori d'une nomenclature3 qui définisse des classes. Dans la vie courante chacun de nous utilise plusieurs nomenclatures : lorsque nous rencontrons une personne, nous nous comportons envers elle en fonction de la catégorie psychosociologique dans laquelle nous la rangeons selon son âge, son habillement, son langage, etc. Lorsque nous sommes au volant nous inférons le comportement prévisible des autres conducteurs selon leur apparence et celle de leur voiture, etc. : nous interprétons ainsi des symptômes pour parvenir à un diagnostic.
L'ensemble des nomenclatures présentes dans l'intellect d'une personne constitue la grille conceptuelle (ou « grille » tout court) à travers laquelle elle se représente le monde tel qu'elle le voit4.
Dans le langage courant, « classement » et « classification » sont parfois synonymes et il en est de même pour « nomenclature » et « classification ». Pour la clarté des idées nous donnons ici à chacun de ces mots un sens précis :
- une nomenclature est la partition d'un domaine de connaissance en « classes » à chacune desquelles est associé un nom ou un code : « nomenclature des activités industrielles », « nomenclature des êtres vivants », etc. ;
- le classement est l'opération qui range un individu dans une classe d'une nomenclature existante : la personne qui dit « cet arbre-là est un mélèze » range un arbre dans la classe « mélèze » d'une nomenclature des arbres ;
- la classification est l'opération qui crée la nomenclature d'un domaine de connaissance.
Intelligence artificielle = analyse discriminante
La statistique a systématisé cette démarche de classement avec diverses méthodes d'analyse discriminante:
- l'analyse factorielle discriminante5 procure les combinaisons linéaires de symptômes qui distinguent au mieux les diagnostics ;
- une machine à vecteurs de support (Support Vector Machines, SVM) indique la frontière, éventuellement sinueuse, qui sépare au mieux les diagnostics dans le nuage de points représentant les individus dans l'espace des symptômes ;
- un réseau neuronal est un ensemble d'algorithmes communiquant par des liaisons, nommées « synapses », dont la pondération non linéaire tâtonne jusqu'à ce que l'interprétation des symptômes soit conforme au diagnostic.
Un réseau neuronal est une « boîte noire » : personne ne peut expliquer pourquoi il est arrivé à telle ou telle conclusion. Cela contrarie les esprits logiques et certains praticiens jugent d'ailleurs les SVM plus efficaces que les réseaux neuronaux. D'autres ont l'opinion contraire, d'autres encore estiment que la meilleure méthode s'appuie sur une combinaison des deux6.
Nous laisserons les experts à leurs controverses pour retenir que ce que l'on nomme « intelligence artificielle » est essentiellement l'application d'une technique statistique, l'analyse discriminante : quelle que soit la méthode qu'elle emploie, elle s'appuie en effet sur la théorie statistique et sur l'informatique complétées (et parfois compliquées) par l'ingéniosité et l'empirisme des praticiens.
Dire que « l'intelligence artificielle, c'est de l'analyse discriminante » suffit, semble-t-il, pour la situer du point de vue des intentions confrontées aux possibilités techniques et aux risques éventuels qui les accompagnent, et aussi pour éviter les analogies hasardeuses que l'expression « intelligence artificielle » a suggérées à certains penseurs.
Un outil de classement
Supposons que l'on considère une population de personnes souffrant d'une maladie. On observe un ensemble de symptômes sur ces personnes. Chacune d'entre elles peut être représentée par un point dans un espace défini par ces symptômes, puis examinée par un médecin qui pose un diagnostic. On peut alors scinder le « nuage » des points qui représentent les patients en plusieurs « sous-nuages » relatifs chacun à un diagnostic.
L'analyse discriminante consiste à tracer, dans l'espace des symptômes, des frontières qui séparent les sous-nuages : la différence entre l'analyse factorielle discriminante, les SVM et les réseaux neuronaux réside dans la façon de définir ces frontières.
Considérons maintenant un individu supplémentaire pour lequel on connaît les symptômes mais non le diagnostic. On observera comment le point qui représente cet individu se situe par rapport aux sous-nuages, et on le classera dans le diagnostic qui correspond au sous-nuage auquel il semble appartenir : cela permet de passer automatiquement des symptômes observés à une estimation du diagnostic. On peut en outre associer à ce diagnostic un « score », degré de vraisemblance d'autant plus élevé que l'individu est plus éloigné des frontières, plus enfoncé dans un sous-nuage.
L'apport de l'intelligence artificielle réside dans le nombre de diagnostics qu'elle considère, et qui excède ce que peut retenir la mémoire d'un médecin, ainsi que dans la rapidité que procure la puissance de l'informatique.
L'analyse discriminante s'applique à d'autres domaines : elle sert à évaluer la crédibilité d'un emprunteur, la qualité d'un coup aux échecs, à reconnaître le contenu d'une image, à traduire automatiquement des textes, etc. Le classement sera statistiquement fiable si l'analyse a été étalonnée sur un nombre suffisant d'observations : le Big Data peut fournir un grand nombre de cas pour lesquels les symptômes et le diagnostic sont connus.
Il se peut que l'événement contredise un classement : le patient ne souffre pas en réalité de la pathologie qui avait été diagnostiquée, un emprunteur dont le score était excellent a fait défaut, aux échecs un coup considéré comme le meilleur s'est révélé malencontreux, etc. Cet événement est pris en compte en introduisant un nouveau point dans l'échantillon sur lequel l'analyse est étalonnée, le dessin des frontières est ainsi modifié et amélioré.
Cet apprentissage réduit progressivement la probabilité d'une erreur de classement. C'est ainsi que l'intelligence artificielle a pu parvenir à battre le champion du monde des échecs, à fournir un diagnostic plus sûr que celui des meilleurs médecins en ce qui concerne les maladies rares, etc.
L'analyse discriminante peut être l'instrument statistique de l'indiscrétion car elle permet d'estimer un attribut que les individus préféreraient cacher (leur opinion politique par exemple) à partir d'indications qu'ils donnent sans méfiance : les grandes entreprises de l'Internet l'utilisent pour diffuser des publicités ou présenter des offres commerciales « personnalisées ». On imagine l'arme que cela peut donner au dirigeant paranoïaque d'un régime totalitaire.
Classement et classification
La façon dont l'intellect définit ses nomenclatures évolue selon les besoins :
- Au XVIe siècle il semblait normal de regrouper les êtres et les faits selon des liens symboliques : pour décrire un animal le naturaliste évoquait son anatomie, la manière de le capturer, son utilisation allégorique, son mode de génération, son habitat, sa nourriture et la meilleure façon de le mettre en sauce7. Plus près de nous il a fallu du temps pour réunir les phénomènes magnétiques et électriques, puis reconnaître la nature électromagnétique de la lumière.
- La nomenclature des êtres vivants a évolué de Linné, Jussieu et Darwin à la « cladistique » contemporaine8. Fondée sur la comparaison génétique, cette dernière a introduit des bouleversements : le crocodile est plus proche des oiseaux que des lézards ; les dinosaures sont toujours parmi nous ; les termes « poissons », « reptiles » ou « invertébrés » ne sont pas scientifiques.
- La nomenclature des industries9 a pris pour critère au XVIIIe siècle l’origine de la matière première (minérale, végétale, animale) conformément à la représentation des physiocrates. Au milieu du XIXe siècle les controverses sur le libre échange ont conduit à un découpage selon l’usage du produit fabriqué. À la fin du XIXe siècle, le critère dominant fut celui des équipements : le souci principal était alors l’investissement. Depuis la deuxième guerre mondiale les nomenclatures sont construites selon un « critère d'association » de façon à découper le moins possible les entreprises, car l’attention se concentre sur le financement.
Les nomenclatures qu'utilisent les institutions évoluent donc. Il en est de même de celles qu'utilisent les personnes, et aussi de la grille conceptuelle que forme l'ensemble de ces nomenclatures.
Chacun peut s'enfermer dans la grille qu'il a héritée de son éducation : il est possible de « gagner sa vie » et de faire carrière en ne connaissant et ne voulant connaître que le « petit monde » auquel elle donne accès, le reste de la réalité étant caché à l'intellect comme par une tache aveugle. C'est ainsi que vivent ceux qui s'enferment dans la tradition ainsi que ceux qui, ayant fait de longues études en élèves conformistes, croient ne plus rien devoir apprendre après l'âge de 25 ans.
Mais chacun peut être ouvert au « grand monde », attentif aux faits qui contrarient éventuellement sa grille, conscient de l'existence de ce qui se cache derrière l'apparence des choses : cette attitude, fort différente de la précédente, s'appuie sur la conscience du caractère subjectif des nomenclatures et incite à les faire évoluer selon les exigences de l'action. Les animateurs et les entrepreneurs sont des personnes ouvertes au « grand monde ».
Si chacun ne peut voir à chaque instant le monde qu'à travers la grille dont il s'est doté, les personnes qui vivent dans le « grand monde » savent que cette grille ne permet pas de tout voir tandis que celles qui vivent dans un « petit monde » croient qu'elle leur suffit pour percevoir convenablement les êtres, les faits et les événements.
La « raison » se manifeste ainsi de deux façons différentes. La pensée des personnes qui vivent dans un « petit monde » est rationnelle quand ils raisonnent de façon logique dans le cadre de leur grille. La pensée des personnes qui vivent dans le « grand monde » peut elle aussi être rationnelle, mais elle est surtout raisonnable car leur intuition est capable de lancer des explorations au-delà des frontières de leur grille : la créativité de la « raison raisonnable » englobe et dépasse les facultés mentales qu'exige la « raison rationnelle ».
À la limite de l'intelligence artificielle
Il est possible de configurer l'intelligence artificielle selon une grille conceptuelle de telle sorte qu'elle puisse réaliser des classements selon les nomenclatures que cette grille comporte : l'intelligence artificielle peut donc en principe, une fois étalonnée, simuler l'intellect d'une personne qui vit dans un « petit monde ».
Est-elle cependant capable de faire autre chose que de l'analyse discriminante, autre chose que du classement selon une nomenclature donnée ? Est-elle capable de concevoir des nomenclatures, de créer des concepts ? Peut-elle simuler l'attention qu'un animateur porte aux événements qui ne s'inscrivent pas dans sa grille ? Peut-elle simuler l'intellect d'une personne qui, vivant dans le « grand monde », est capable de créer des nomenclatures nouvelles et pertinentes car adéquates à l'action judicieuse dans une situation inédite ?
L'intellect prépare une classification en effectuant les choix suivants10 :
- choisir l'ensemble E à classifier en définissant les éléments (« individus ») qui le composent ;
- choisir les attributs observés sur chaque individu ;
- choisir pour chaque couple (x, y) d'individus une distance d(x, y), fonction de la différence entre leurs attributs (« critère de classification ») ;
- choisir entre les sous-ensembles X et Y de E une distance D(X, Y) (« stratégie d'agrégation »).
Une fois ces choix opérés la nomenclature peut être produite par une classification automatique : l'informatique est là encore présente et efficace et on peut, si l'on veut, parler encore d'intelligence artificielle.
Mais pour décider de construire une nouvelle nomenclature il faut avoir ressenti le besoin de le faire puis choisi l'ensemble à classifier, les attributs à observer, le critère de classification et la stratégie d'agrégation. Cela suppose que l'intuition ait perçu l'inadéquation de la grille conceptuelle en regard des exigences de la situation et lancé la démarche exploratoire qui lui permettra de créer des concepts nouveaux et pertinents.
Le bon sens de l'entrepreneur et de l'animateur, l'art du créateur, dépassent eux aussi les limites de la grille conceptuelle : leur intuition embrasse le monde, éveillée par une émotion qui provoque dans leur corps des décharges électriques et hormonales11. Cette intuition et cette émotion, formées par l'éducation et cultivées par l'exercice, procurent au stratège le « coup d'oeil » qui l'orientera vers la décision judicieuse dans l'incertitude, l'urgence, et malgré le brouillard que créent des rapports incomplets ou fallacieux.
Nous touchons semble-t-il la limite de l'intelligence artificielle. Elle est plus puissante, plus rapide que ne l'est l'être humain lorsqu'il s'agit de classer des faits, des êtres, des événements, dans une nomenclature ou une grille conceptuelle données, puis de décider en conséquence : c'est ce qui lui permet de vaincre les meilleurs joueurs aux échecs, au jeu de Go et au poker.
Elle est cependant dépourvue du bon sens qui permet d'outrepasser la grille conceptuelle, elle est insensible à l'émotion qui signale au corps les situations où cette grille n'est plus pertinente, et donc dépourvue de l'intuition qui dépasse les frontières rationnelles de l'intellect pour explorer le « grand monde » de façon raisonnable en surmontant, comme a dit Alan Turing dans la dernière phrase de son dernier article12, « the inadequacy of "reason" unsupported by common sense ».
L'intelligence artificielle va s'emparer de nombre des tâches effectuées auparavant par des personnes qui vivaient dans les limites d'un « petit monde ». Cela nous invite à vivre dans le « grand monde », à relativiser notre grille conceptuelle, à ouvrir notre intuition. De ce point de vue l'intelligence artificielle n'est pas une menace : elle nous libère.
_____
1 C'est ce que fait Alexa, service d'IA d'Amazon : les mots, une fois écrits, sont interprétés comme des commandes adressées à des équipements (Lélia de Matharel, « Amazon envahit le monde avec son intelligence artificielle Alexa », Journal du Net, 19 avril 2017).
2 Watson analyse les messages électroniques que reçoivent les conseillers du Crédit mutuel pour sélectionner les plus urgents et proposer des réponses personnalisables (Véronique Chocron, « Le Crédit mutuel déploie le robot d'intelligence artificielle Watson dans son réseau », Le Monde, 20 avril 2017).
3 « Nomenclature » a plusieurs synonymes : « taxonomie », « typologie », « classification », etc. « Classification » désigne aussi l'opération qui consiste à créer une nomenclature : nous retiendrons cette acception du mot.
4 Nous croyons « naturelle » la grille dont nous avons l'habitude et qualifions d’« objectives » les observations que nous réalisons selon cette grille, qui s'appuie cependant sur le choix subjectif des nomenclatures.
5 Michel Volle, Analyse des données, Economica, 1997, p. 206.
6 Yichuan Tang, « Deep Learning using Linear Support Vector Machines », International Conference on Machine Learning, 2013.
7 Michel Foucault, Les mots et les choses, Gallimard, 1966, p. 141.
8 Guillaume Lecointre et Hervé Le Guyader, Classification phylogénétique du vivant, Belin, 2001.
9 Bernard Guibert, Jean Laganier et Michel Volle, « Essai sur les nomenclatures industrielles », Économie et statistique, n° 20, février 1971.
10 Michel Volle, op. cit., p. 266.
11 Jean-Didier Vincent, Biologie des passions, Odile Jacob, 1986.
12 Alan Turing, « Solvable and Unsolvable Problems », Science News, 1954.
Merci, cher Michel ! Cela me rappelle une époque ancienne! Bravo pour ton analyse, pertinente comme toujours!
RépondreSupprimerNous partageons en effet le même intérêt pour les nomenclatures...
SupprimerOù classer l'intelligence artificielle parfois appelée "symbolique" , à base de règles, connaissances, inférences, raisonnements, parfois aussi dénommée "vielle IA", comme celle des systèmes experts ? Et peut-on aborder le problème de la compréhension -par opposition à la traduction- du langage naturel comme un problème de classement ?
RépondreSupprimerLe "problème de la compréhension" ne me semble pas concerner l'IA.
SupprimerLes systèmes experts ont rencontré des obstacles :
- la collecte des règles qu'utilisent les experts est très pénible ;
- certaines de leurs règles sont implicites, ils ne savent pas les expliciter : le système expert sera donc inévitablement incomplet ;
- il faut renouveler de temps à autre la collecte pour mettre à jour le système expert parce que les experts modifient leurs règles lorsque la conjoncture.change.
Ces obstacles se sont révélés pratiquement insurmontables. C'est, me semble-t-il, la raison pour laquelle l'IA s'est détournée des systèmes experts pour se focaliser sur le diagnostic, où l'analyse discriminante peut atteindre des performances élevées une fois étalonnée sur une base de données assez riche.
Le dernier numéro de Spectrum contient un excellent article sur la mise en oeuvre de l'IA pour faciliter le diagnostic du cancer du col de l'utérus : Cary Champlin, David Bell et Celina Schocken, "AI Medicine Comes to Africa's Rural Clinics", Spectrum, mai 2017.
cela serait une plus longue discussion, mais "le problème de la compréhension" me semble de mon côté au cœur de l'IA ... Par ailleurs, la société EURODECISION vient de livrer deux systèmes experts "à l'ancienne" à AIRBUS Hélicoptères (aide au dépannage) et à Réseaux Ferrés de France (gestion des commandes).
SupprimerBonjour Michel,
RépondreSupprimerLa classification s'appuie sur l'apprentissage, et je me demande si les réseaux auto-apprenants ne pourraient pas aboutir à une "presque intuition"...
J'en profite pour vous indiquer le site de la startup de mon fils, qui a induit pas mal de buzz grâce à sa démo : lyrebird.ai
Par exemple : https://www.scientificamerican.com/article/new-ai-tech-can-mimic-any-voice/
Bien à vous,
Patrick
Traduire la parole imprimée en parole vocale (y compris en imitant la voix de quelqu'un) est en effet une application réussie de l'informatique. Elle réussit moins bien dans la traduction de la parole vocale en parole écrite.
SupprimerIl y a 25 ans, on disait ironiquement "si une application d'IA se met à marcher, ce n'est plus de l'IA". Tu proposes donc l'inverse "si ça ne marche pas, ce n'est pas de l'IA" ?
RépondreSupprimerL'IA a tâtonné à la recherche de l'efficacité. Les systèmes experts semblaient pouvoir bien marcher mais ils ont rencontré des difficultés pratiquement insurmontables. L'analyse discriminante, qui semblait a priori moins intéressante, lui a offert les techniques qui lui ont enfin permis de progresser et de remporter des succès impressionnants.
SupprimerBonjour Michel
RépondreSupprimerC'est dommage que l'analyse factorielle discriminate soit parfois si peu utilisée.
Voici par ailleurs in line vers un article qua corrige quelques idées reçues:
https://spectrum-ieee-org.cdn.ampproject.org/c/spectrum.ieee.org/robotics/artificial-intelligence/machinelearning-maestro-michael-jordan-on-the-delusions-of-big-data-and-other-huge-engineering-efforts.amp.html