L’IA est sans conteste le sujet dominant de nos sociétés actuelles, mais que savons-nous au fond des origines de l’IA, en dehors de l’imaginaire de la pop culture qui a devancé la réalité ?
L’IA débute avec un homme : John McCarthy, mathématicien, informaticien et professeur universitaire américain, est né le à Boston dans une famille irlando-lithuanienne ayant migré aux États-Unis. Il est décédé le à Stanford, en Californie. Avec Marvin Minsky, il est considéré actuellement comme l’un des pionniers de l’intelligence artificielle.
Passionné très tôt par les mathématiques, John McCarthy décroche une place à l’Institut de technologie de Californie (Caltech), d’où il sort diplômé en 1948. Après avoir assisté à un symposium sur les « Mécanismes cérébraux du comportement », il entreprend alors de développer des machines capables de penser comme des humains. C’est en toute logique (humaine) qu’il obtient un doctorat dans cette discipline en 1951. À la fin des années 1950, après un doctorat en mathématiques, il crée avec Fernando Corbató la technique du temps partagé, qui permet à plusieurs utilisateurs d’employer simultanément un même ordinateur. Après des postes de courte durée à Princeton et à l’université de Stanford , McCarthy devint professeur adjoint au Dartmouth College en 1955. C’est dans ce contexte que la même année, il préside la conférence de Dartmouth. Cette dernière, organisée par Claude Shannon, John McCarthy, Nathaniel Rochester et Marvin Minsky, se présente alors comme étant un projet de recherche d’été sur l’intelligence artificielle (Dartmouth Summer Research Project on Artificial Intelligence). Il est, depuis lors, considéré comme l’événement fondateur de l’intelligence artificielle en tant que domaine à part entière. Nous vous proposons la retranscription de l’intervention de John McCarthy où ce dernier définit ce qu’est l’IA pour la première fois. Reste à savoir quelle est sa définition de l’intelligence …
Notons d’ailleurs que les sources divergent quant à la date de cette fameuse université d’été : certaines évoquent l’année 1955, d’autres l’année 1956 … ChatGPTT ne vous le dira peut-être pas, mais elle est bien datée du 31 août 1955 😉
Version française
Extrait n° 1 : définition d’une intelligence issue d’une machine
Nous proposons qu’une étude de deux mois, menée par dix personnes, soit réalisée durant l’été 1956 au Dartmouth College à Hanover, dans le New Hampshire. Cette étude se fonde sur l’hypothèse que tout aspect de l’apprentissage, ou toute autre caractéristique de l’intelligence, peut en principe être décrit avec une telle précision qu’une machine puisse le simuler. L’objectif est de déterminer comment doter les machines du langage, de la capacité à formuler des abstractions et des concepts, à résoudre des problèmes actuellement réservés aux humains et à s’améliorer. Nous pensons qu’une avancée significative peut être réalisée sur un ou plusieurs de ces points si un groupe de scientifiques soigneusement sélectionnés y travaille ensemble durant un été.
Voici quelques aspects du problème de l’intelligence artificielle :
1Ordinateurs automatiques
Si une machine peut accomplir une tâche, une calculatrice automatique peut être programmée pour la simuler. La vitesse et la capacité de mémoire des ordinateurs actuels sont peut-être insuffisantes pour simuler nombre de fonctions supérieures du cerveau humain, mais le principal obstacle n’est pas le manque de puissance machine, mais notre incapacité à concevoir des programmes exploitant pleinement les capacités dont nous disposons.
2.Comment programmer un ordinateur pour qu’il utilise une langue ?
On peut supposer qu’une grande partie de la pensée humaine consiste à manipuler les mots selon des règles de raisonnement et de conjecture. De ce point de vue, former une généralisation revient à admettre un nouveau mot et certaines règles selon lesquelles les phrases qui le contiennent impliquent d’autres phrases et sont impliquées par elles. Cette idée n’a jamais été formulée avec précision ni illustrée par des exemples.
3.Réseaux de neurones
Comment un ensemble de neurones (hypothétiques) peut-il être organisé pour former des concepts ? De nombreux travaux théoriques et expérimentaux ont été consacrés à ce problème par Uttley, Rashevsky et son équipe, Farley et Clark, Pitts et McCulloch, Minsky, Rochester et Holland, et d’autres. Des résultats partiels ont été obtenus, mais le problème nécessite des recherches théoriques plus approfondies.
4.Théorie de la taille d’un calcul
Face à un problème bien défini (pour lequel il est possible de vérifier mécaniquement la validité d’une réponse proposée), une méthode de résolution consiste à tester successivement toutes les réponses possibles. Cette méthode étant inefficace, il est nécessaire de disposer d’un critère d’efficacité de calcul pour l’éviter. On constatera que mesurer l’efficacité d’un calcul requiert une méthode permettant de mesurer la complexité des dispositifs de calcul, ce qui est possible grâce à une théorie de la complexité des fonctions. Shannon et McCarthy ont obtenu des résultats partiels sur ce problème.
5.Amélioration personnelle
Une machine véritablement intelligente accomplira probablement des activités que l’on pourrait qualifier d’auto-amélioration. Plusieurs méthodes ont été proposées à cet effet et méritent d’être étudiées plus en détail. Il semble probable que cette question puisse également être abordée de manière abstraite.
6.Abstractions
On peut définir avec précision plusieurs types d’« abstraction », et d’autres de façon plus floue. Il serait pertinent de tenter de les classifier et de décrire les méthodes informatiques permettant de former des abstractions à partir de données sensorielles et autres.
7.Aléatoire et créativité
Une hypothèse assez séduisante, quoique manifestement incomplète, suggère que la différence entre la pensée créative et la pensée compétente, mais dépourvue d’imagination, réside dans l’introduction d’une part d’aléatoire. Cet aléatoire doit être guidé par l’intuition pour être efficace. Autrement dit, l’intuition éclairée ou le pressentiment intègrent un aléatoire maîtrisé au sein d’une pensée par ailleurs structurée.[…]
Version américaine d’origine :
We propose that a 2 month, 10 man study of artificial intelligence be carried out during the summer of 1956 at Dartmouth College in Hanover, New Hampshire. The study is to proceed on the basis of the conjecture that every aspect of learning or any other feature of intelligence can in principle be so precisely described that a machine can be made to simulate it. An attempt will be made to find how to make machines use language, form abstractions and concepts, solve kinds of problems now reserved for humans, and improve themselves. We think that a significant advance can be made in one or more of these problems if a carefully selected group of scientists work on it together for a summer.
The following are some aspects of the artificial intelligence problem:
1 Automatic Computers
If a machine can do a job, then an automatic calculator can be programmed to simulate the machine. The speeds and memory capacities of present computers may be insufficient to simulate many of the higher functions of the human brain, but the major obstacle is not lack of machine capacity, but our inability to write programs taking full advantage of what we have.
2. How Can a Computer be Programmed to Use a Language
It may be speculated that a large part of human thought consists of manipulating words according to rules of reasoning and rules of conjecture. From this point of view, forming a generalization consists of admitting a new word and some rules whereby sentences containing it imply and are implied by others. This idea has never been very precisely formulated nor have examples been worked out.
3. Neuron Nets
How can a set of (hypothetical) neurons be arranged so as to form concepts. Considerable theoretical and experimental work has been done on this problem by Uttley, Rashevsky and his group, Farley and Clark, Pitts and McCulloch, Minsky, Rochester and Holland, and others. Partial results have been obtained but the problem needs more theoretical work.
4. Theory of the Size of a Calculation
If we are given a well-defined problem (one for which it is possible to test mechanically whether or not a proposed answer is a valid answer) one way of solving it is to try all possible answers in order. This method is inefficient, and to exclude it one must have some criterion for efficiency of calculation. Some consideration will show that to get a measure of the efficiency of a calculation it is necessary to have on hand a method of measuring the complexity of calculating devices which in turn can be done if one has a theory of the complexity of functions. Some partial results on this problem have been obtained by Shannon, and also by McCarthy.
5. Self-lmprovement
Probably a truly intelligent machine will carry out activities which may best be described as self-improvement. Some schemes for doing this have been proposed and are worth further study. It seems likely that this question can be studied abstractly as well.
6. Abstractions
A number of types of « abstraction » can be distinctly defined and several others less distinctly. A direct attempt to classify these and to describe machine methods of forming abstractions from sensory and other data would seem worthwhile.
7. Randomness and Creativity
A fairly attractive and yet clearly incomplete conjecture is that the difference between creative thinking and unimaginative competent thinking lies in the injection of a some randomness. The randomness must be guided by intuition to be efficient. In other words, the educated guess or the hunch include controlled randomness in otherwise orderly thinking.
***
Extrait n° 2 : qu’attendre de la machine ?
Originalité dans les performances de la machine
Lorsqu’on programme une calculatrice automatique, on lui fournit généralement un ensemble de règles pour couvrir toutes les situations imprévues. On attend de la machine qu’elle suive ces règles à la lettre, sans faire preuve d’originalité ni de bon sens. De plus, on s’en prend à soi-même lorsque la machine se dérègle à cause de règles légèrement contradictoires. Enfin, la programmation informatique oblige parfois à aborder les problèmes de manière fastidieuse, alors que si la machine possédait un minimum d’intuition ou pouvait formuler des hypothèses raisonnables, la solution serait beaucoup plus directe. Cet article présente une hypothèse visant à rendre une machine plus sophistiquée dans le domaine évoqué ci-dessus. Il aborde un problème sur lequel je travaille sporadiquement depuis environ cinq ans et que je souhaite approfondir dans le cadre du projet d’intelligence artificielle l’été prochain.
Le processus d’invention ou de découverte
Vivre dans l’environnement de notre culture nous fournit des méthodes pour résoudre de nombreux problèmes. Le fonctionnement précis de ces méthodes reste encore flou, mais j’aborderai cet aspect du problème à l’aide d’un modèle proposé par Craik
. Selon ce modèle, l’activité mentale consiste essentiellement à construire, au sein du cerveau, de petits moteurs capables de simuler et donc de prédire des abstractions relatives à l’environnement. Ainsi, la résolution d’un problème que l’on comprend déjà se déroule comme suit :
- L’environnement fournit des données à partir desquelles certaines abstractions sont formées.
- Les abstractions, associées à certaines habitudes ou pulsions internes, permettent :
- Définition d’un problème en termes de condition souhaitée à atteindre à l’avenir, un objectif.
- Une action suggérée pour résoudre le problème.
- Stimuler le cerveau pour activer le mécanisme correspondant à cette situation.
- Le moteur fonctionne ensuite pour prédire à quoi mèneront cette situation environnementale et la réaction proposée.
- Si la prédiction correspond à l’objectif, l’individu agit comme indiqué.
La prédiction correspondra à l’objectif si le fait de vivre dans son environnement culturel a permis à l’individu de trouver la solution au problème. Considérant l’individu comme un calculateur à programme intégré, le programme contient des règles pour couvrir cette éventualité particulière.
Dans une situation plus complexe, les règles peuvent être plus compliquées. Elles peuvent exiger de tester chacune des actions possibles pour déterminer laquelle a permis d’obtenir la solution. Un ensemble de règles encore plus complexe peut prendre en compte l’incertitude liée à l’environnement, comme par exemple au morpion, où il faut considérer non seulement son prochain coup, mais aussi les différents coups possibles de l’environnement (son adversaire).
Considérons maintenant un problème pour lequel aucun membre de la culture ne possède de solution et qui a résisté à toute tentative de résolution. Il pourrait s’agir d’un problème scientifique actuel non résolu. L’individu pourrait essayer de le résoudre et constater que toute action raisonnable a mené à l’échec. Autrement dit, le programme interne contient des règles pour la résolution de ce problème, mais ces règles sont légèrement erronées. […]
Version américaine d’origine :
Originality in Machine Performance
In writing a program for an automatic calculator, one ordinarily provides the machine with a set of rules to cover each contingency which may arise and confront the machine. One expects the machine to follow this set of rules slavishly and to exhibit no originality or common sense. Furthermore one is annoyed only at himself when the machine gets confused because the rules he has provided for the machine are slightly contradictory. Finally, in writing programs for machines, one sometimes must go at problems in a very laborious manner whereas, if the machine had just a little intuition or could make reasonable guesses, the solution of the problem could be quite direct. This paper describes a conjecture as to how to make a machine behave in a somewhat more sophisticated manner in the general area suggested above. The paper discusses a problem on which I have been working sporadically for about five years and which I wish to pursue further in the Artificial Intelligence Project next summer.
The Process of Invention or Discovery
Living in the environment of our culture provides us with procedures for solving many problems. Just how these procedures work is not yet clear but I shall discuss this aspect of the problem in terms of a model suggested by Craik
. He suggests that mental action consists basically of constructing little engines inside the brain which can simulate and thus predict abstractions relating to environment. Thus the solution of a problem which one already understands is done as follows:
- The environment provides data from which certain abstractions are formed.
- The abstractions together with certain internal habits or drives provide:
- A definition of a problem in terms of desired condition to be achieved in the future, a goal.
- A suggested action to solve the problem.
- Stimulation to arouse in the brain the engine which corresponds to this situation.
- Then the engine operates to predict what this environmental situation and the proposed reaction will lead to.
- If the prediction corresponds to the goal the individual proceeds to act as indicated.
The prediction will correspond to the goal if living in the environment of his culture has provided the individual with the solution to the problem. Regarding the individual as a stored program calculator, the program contains rules to cover this particular contingency.
For a more complex situation the rules might be more complicated. The rules might call for testing each of a set of possible actions to determine which provided the solution. A still more complex set of rules might provide for uncertainty about the environment, as for example in playing tic tac toe one must not only consider his next move but the various possible moves of the environment (his opponent).
Now consider a problem for which no individual in the culture has a solution and which has resisted efforts at solution. This might be a typical current unsolved scientific problem. The individual might try to solve it and find that every reasonable action led to failure. In other words the stored program contains rules for the solution of this problem but the rules are slightly wrong. […]
Source : J. McCarthy et alii, A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence , 31 août 1955. Source : site de l’université de Stanford ICI

