Sur la nature du raisonnement mathématique (Poincaré)
La possibilité même de la science mathématique semble une contradiction insoluble. Si cette science n’est déductive qu’en apparence, d’où lui vient cette parfaite rigueur que personne ne songe à mettre en doute ? Si, au contraire, toutes les propositions qu’elle énonce peuvent se tirer les unes des autres par les règles de la logique formelle, comment la mathématique ne se réduit-elle pas à une immense tautologie ? Le syllogisme ne peut rien nous apprendre d’essentiellement nouveau et, si tout devait sortir du principe d’identité, tout devrait aussi pouvoir s’y ramener. Admettra-t-on donc que les énoncés de tous ces théorèmes qui remplissent tant de volumes ne soient que des manières détournées de dire que A est A ?
Sans doute, on peut remonter aux axiomes qui sont à la source de tous ces raisonnements. Si on juge qu’on ne peut les réduire au principe de contradiction, si on ne veut pas non plus y voir des faits expérimentaux qui ne pourraient participer à la nécessité mathématique, on a encore la ressource de les classer parmi les jugements synthétiques a priori. Ce n’est pas résoudre la difficulté, c’est seulement la baptiser ; et lors même que la nature des jugements synthétiques n’aurait plus pour nous de mystère, la contradiction ne se serait pas évanouie, elle n’aurait fait que reculer ; le raisonnement syllogistique reste incapable de rien ajouter aux données qu’on lui fournit ; ces données se réduisent à quelques axiomes et on ne devrait pas retrouver autre chose dans les conclusions.
Aucun théorème ne devrait être nouveau si dans sa démonstration n’intervenait un axiome nouveau ; le raisonnement ne pourrait nous rendre que les vérités immédiatement évidentes empruntées à l’intuition directe ; il ne serait plus qu’un intermédiaire parasite et dès lors n’aurait-on pas lieu de se demander si tout l’appareil syllogistique ne sert pas uniquement à dissimuler notre emprunt ?
La contradiction nous frappera encore davantage si nous ouvrons un livre quelconque de mathématiques ; à chaque page l’auteur annoncera l’intention de généraliser une proposition déjà connue. Est-ce donc que la méthode mathématique procède du particulier au général et comment alors peut-on l’appeler déductive ?
Si enfin la science du nombre était purement analytique, ou pouvait sortir analytiquement d’un petit nombre de jugements synthétiques, il semble qu’un esprit assez puissant pourrait d’un seul coup d’oeil en apercevoir toutes les vérités ; que dis-je ! on pourrait même espérer qu’un jour on inventera pour les exprimer un langage assez simple pour qu’elles apparaissent ainsi immédiatement à une intelligence ordinaire.
Si l’on se refuse à admettre ces conséquences, il faut bien concéder que le raisonnement mathématique a par lui-même une sorte de vertu créatrice et par conséquent qu’il se distingue du syllogisme.
La différence doit même être profonde. Nous ne trouverons la clef du mystère ni dans l’emploi incessant du syllogisme hypothétique[1], ni dans la substitution de la copule à la copule est, ni dans l’usage fréquent de cette règle d’après laquelle une même opération uniforme appliquée à deux nombres égaux donnera des résultats identiques.
Tous ces modes de raisonnement, qu’ils soient ou non réductibles au syllogisme proprement dit, conservent le caractère analytique et sont par cela même impuissants.
Le débat est ancien ; déjà Leibnitz cherchait à démontrer que 2 et 2 font 4 ; examinons un peu sa démonstration.
Je suppose que l’on ait défini le nombre et l’opération qui consiste à ajouter l’unité à un nombre donné .
Ces définitions, quelles qu’elles soient, n’interviendront pas dans la suite du raisonnement.
Je définis ensuite les nombres , et par les égalités :
(1) ; (2) ; (3)
Je définis de même l’opération par la relation :
(4)
Cela posé nous avons :
(Définition 4)
(Définition 2)
(Définition 3)
d’où :
C. q. f. d.
On ne saurait nier que ce raisonnement ne soit purement analytique. Mais interrogez un mathématicien quelconque : « Ce n’est pas une démonstration proprement dite, vous répondra-t-il, c’est une vérification ». On s’est borné à rapprocher l’une de l’autre deux définitions purement conventionnelles et on a constaté leur identité ; on n’a ainsi rien appris de nouveau. La « vérification » diffère précisément de la véritable démonstration, parce qu’elle est purement analytique et parce qu’elle est stérile. Elle est stérile parce que la conclusion n’est que la traduction des prémisses dans un autre langage. La démonstration véritable est féconde au contraire parce que la conclusion y est en un sens plus générale que les prémisses.
L’égalité n’a été ainsi susceptible d’une vérification que parce qu’elle est particulière. Tout énoncé particulier en mathématiques pourra toujours être vérifié de la sorte. Mais si la mathématique devait se réduire à une suite de pareilles vérifications, elle ne serait pas une science. Ainsi un joueur d’échecs, par exemple, ne crée pas une science en gagnant une partie. Il n’y a de science que du général.
On peut même dire que les sciences exactes ont précisément pour objet de nous dispenser de ces vérifications directes.
Voyons donc le géomètre à l’œuvre et cherchons à surprendre ses procédés.
La tâche n’est pas sans difficulté ; il ne suffit pas d’ouvrir un ouvrage au hasard et d’y analyser une démonstration quelconque.
Nous devons exclure d’abord la géométrie où la question se complique des problèmes ardus relatifs au rôle des postulats, à la nature et à l’origine de la notion d’espace. Pour des raisons analogues, nous ne pouvons nous adresser à l’analyse infinitésimale. Il nous faut chercher la pensée mathématique là où elle est restée pure, c’est-à -dire en arithmétique.
Encore faut-il choisir ; dans les parties les plus élevées de la théorie des nombres, les notions mathématiques primitives ont déjà subi une élaboration si profonde, qu’il devient difficile de les analyser. C’est donc au début de l’arithmétique que nous devons nous attendre à trouver l’explication que nous cherchons ; mais il arrive justement que c’est dans la démonstration des théorèmes les plus élémentaires que les auteurs des traités classiques ont déployé le moins de précision et de rigueur. Il ne faut pas leur en faire un crime ; ils ont obéi à une nécessité ; les débutants ne sont pas préparés à la véritable rigueur mathématique ; ils n’y verraient que de vaines et fastidieuses subtilités ; on perdrait son temps à vouloir trop tôt les rendre plus exigeants ; il faut qu’ils refassent rapidement, mais sans brûler d’étapes, le chemin qu’ont parcouru lentement les fondateurs de la science.
Pourquoi une si longue préparation est elle nécessaire pour s’habituer à celle rigueur parfaite, qui, semble-t-il, devrait s’imposer naturellement à tous les bons esprits ? C’est là un problème logique et psychologique bien digne d’être médité.
Mais nous ne nous y arrêterons pas ; il est étranger à notre objet ; tout ce que je veux retenir, c’est que, sous peine de manquer notre but, il nous faut refaire les démonstrations des théorèmes les plus élémentaires et leur donner non la forme grossière qu’on leur laisse pour ne pas lasser les débutants, mais celle qui peut satisfaire un géomètre exercé.
Qu’on me permette, pour mieux faire comprendre cette nécessité, de rappeler une phrase d’un article de M. Ballue dans le dernier numéro de la Revue (p. 321).
« Cette propriété (que ) ne peut se démontrer à notre connaissance que par l’intervention des pluralités (c’est-à-dire, d’après M. Ballue, par un appel à l’expérience). Qu’on se rappelle la figure ci-jointe (formée de 6 lignes de 4 points chacune) qui se trouve dans tous les traités d’arithmétique. »
Il y a une démonstration plus satisfaisante mais peu connue, et c’est pourquoi je crois devoir reproduire ici, au risque d’être fastidieux, les démonstrations rigoureuses des propriétés fondamentales de l’addition et de la multiplication.
Je suppose qu’on ait défini préalablement l’opération qui consiste à ajouter le nombre à un nombre donné .
Cette définition, quelle qu’elle soit d’ailleurs, ne jouera plus aucun rôle dans la suite des raisonnements.
Il s’agit maintenant de définir l’opération qui consiste à ajouter le nombre à un nombre donné .
Supposons que l’on ait défini l’opération , l’opération sera définie par l’égalité :
(1).
Nous saurons donc ce que c’est que quand nous saurons ce que c’est que et comme j’ai supposé au début que l’on savait ce que c’est que on pourra définir successivement et « par récurrence » les opérations , , etc.
Cette définition mérite un moment d’attention, elle est d’une nature particulière qui la distingue déjà de la définition purement logique ; l’égalité (1) contient en effet une infinité de définitions distinctes, chacune d’elles n’ayant un sens que quand on connaît celle qui la précède.
Je dis que
.
En effet le théorème est vrai pour ; il s’écrit alors :
.
ce qui n’est autre chose, à la différence des notations près, que l’égalité (1) par laquelle je viens de définir l’addition.
Supposons que le théorème soit vrai pour , je dis qu’il sera vrai pour .
Soit en effet
;
on en déduira successivement :
ou en vertu de la définition (1)
ce qui montre que le théorème est vrai pour .
Étant vrai pour , on verrait ainsi successivement qu’il l’est pour , pour , etc.
1o Je dis que
Le théorème est évidemment vrai pour , je dis que s’il est vrai pour , il le sera pour .
Soit en effet :
nous en déduirons
ou bien puisque l’addition est associative :
Le théorème sera donc vrai pour ; or il l’est pour , il le sera donc pour , pour , etc. ; c’est ce qu’on exprime en disant que la proposition énoncée est démontrée par récurrence.
2o Je dis que
Le théorème vient d’être démontré pour , je dis que s’il est vrai pour , il le sera pour .
Soit en effet
il viendra :
ou
La proposition est donc établie par récurrence.
Nous définirons la multiplication par les égalités
(2)
L’égalité (2) renferme comme l’égalité (1) une infinité de définitions ; ayant défini , elle permet de définir successivement : , , etc.
Je dis que
.
L’égalité est vraie pour ; car alors elle se réduit à
.
ou, en vertu de la définition que je viens de donner, à :
.
Je dis que si le théorème est vrai pour , il sera vrai pour . Soit en effet :
.
il viendra :
.
En vertu de la définition de la multiplication le premier membre n’est autre chose que :
,
et en vertu des propriétés de l’addition, le second membre peut s’écrire :
ou enfin
On aura donc :
La proposition est encore démontrée par récurrence.
1o Je dis que
Le théorème est évident pour .
Il me reste à faire voir que s’il est vrai pour , il sera vrai pour .
Soit en effet :
il viendra :
ou, en vertu des deux égalités par lesquelles nous avons ci-dessus défini la multiplication,
ou, en se servant encore de la première de ces deux égalités,
2o Je dis que
Le théorème vient d’être démontré pour . Il me reste à faire voir que s’il est vrai pour .
Soit en effet :
il viendra
.
Le premier membre en vertu de la définition de la multiplication peut s’écrire :
et le second membre (à cause de la distributivité de la multiplication) se réduit à
.
On a donc
.
J’arrête là celle série monotone de raisonnements. Mais cette monotonie même a mieux fait ressortir le procédé qui est uniforme et qu’on retrouve à chaque pas.
Ce procédé c’est la démonstration par récurrence. On établit d’abord un théorème pour ; on montre ensuite que s’il est vrai de , il est vrai de ; et on en conclut qu’il est vrai pour tous les nombres entiers.
On vient de voir comment on peut s’en servir pour démontrer les régies de l’addition et de la multiplication, c’est-à-dire les règles du calcul algébrique ; ce calcul est un instrument de transformation qui se prête à beaucoup plus de combinaisons diverses que le simple syllogisme ; mais c’est encore un instrument purement analytique et incapable de rien nous apprendre de nouveau. Si les mathématiques n’en avaient pas d’autre elles seraient donc tout de suite arrêtées dans leur développement ; mais elles ont de nouveau recours au même procédé, c’est-à-dire au raisonnement par récurrence et elles peuvent continuer leur marche en avant.
À chaque pas, si on y regarde bien, on retrouve ce mode de raisonnement, soit sous la forme simple que nous venons de lui donner, soit sous une forme plus ou moins modifiée.
C’est donc bien là le raisonnement mathématique par excellence et il nous faut l’examiner de plus près.
Le caractère essentiel du raisonnement par récurrence c’est qu’il contient, condensés pour ainsi dire en une formule unique, une infinité de syllogismes.
Pour qu’on s’en puisse mieux rendre compte, je vais énoncer les uns après les autres ces syllogismes qui sont, si l’on veut me passer l’expression, disposés en cascade.
Ce sont bien entendu des syllogismes hypothétiques.
Le théorème est vrai du nombre 1.
Or s’il est vrai de 1, il est vrai de 2,
Donc il est vrai de 2.
Or s’il est vrai de 2, il est vrai de 3.,
Donc il est vrai de 3.
et ainsi de suite.
On voit que la conclusion de chaque syllogisme sert de mineure au suivant.
De plus les majeures de tous nos syllogismes peuvent être ramenées à une formule unique.
Si le théorème est vrai de , il l’est de .
On voit donc que dans le raisonnement par récurrence, on se borne à énoncer la mineure du premier syllogisme, et la formule générale qui contient comme cas particuliers toutes les majeures.
Cette suite de syllogismes qui ne finirait jamais se trouve ainsi réduite à une phrase de quelques lignes.
Il est facile maintenant de comprendre pourquoi toute conséquence particulière d’un théorème peut, comme je l’ai expliqué plus haut, être vérifiée par des procédés purement analytiques.
Si au lieu de montrer que notre théorème est vrai de tous les nombres, nous voulons seulement faire voir qu’il est vrai du nombre 6 par exemple, il nous suffira d’établir les 5 premiers syllogismes de notre cascade ; il nous en faudrait 9 si nous voulions démontrer le théorème pour le nombre 10 ; il nous en faudrait davantage encore pour un nombre plus grand ; mais quelque grand que soit ce nombre, nous finirions toujours par l’atteindre, et la vérification analytique serait possible.
Et cependant, quelque loin que nous allions ainsi nous ne nous élèverions jamais jusqu’au théorème général, applicable à tous les nombres, qui seul peut être objet de science. Pour y arriver, il faudrait une infinité de syllogismes, il faudrait franchir un abîme que la patience de l’analyste, réduit aux seules ressources de la logique formelle, ne parviendra jamais à combler.
Je demandais au début pourquoi on ne saurait concevoir un esprit assez puissant pour apercevoir d’un seul coup d’œil l’ensemble des vérités mathématiques.
La réponse est aisée maintenant ; un joueur d’échecs peut combiner quatre coups, cinq coups d’avance ; mais, si extraordinaire qu’on le suppose, il n’en préparera jamais qu’un nombre fini ; s’il applique ses facultés à l’arithmétique, il ne pourra en apercevoir les vérités générales d’une seule intuition directe ; pour parvenir au plus petit théorème, il ne pourra s’affranchir de l’aide du raisonnement par récurrence parce que c’est un instrument qui permet de passer du fini à l’infini.
Cet instrument est toujours utile, puisque, nous faisant franchir d’un bond autant d’étapes que nous le voulons, il nous dispense de vérifications longues, fastidieuses et monotones qui deviendraient rapidement impraticables. Mais il devient indispensable dès qu’on vise au théorème général, dont la vérification analytique nous rapprocherait sans cesse, sans nous permettre jamais de l’atteindre.
Dans ce domaine de l’arithmétique, on peut se croire bien loin de lanalyse infinitésimale, et cependant, nous venons de le voir, l’idée de l’infini mathématique joue déjà un rôle prépondérant, et sans elle il n’y aurait pas de science parce qu’il n’y aurait rien de général.
Le jugement sur lequel repose le raisonnement par récurrence peut être mis sous d’autres formes : on peut dire par exemple que dans une collection infinie de nombres entiers différents, il y en a toujours un qui est plus petit que tous les autres.
On pourra passer facilement d’un énoncé à l’autre ; et se donner ainsi l’illusion qu’on a démontré la légitimité du raisonnement par récurrence. Mais on sera toujours arrêté ; on arrivera toujours à un axiome indémontrable qui ne sera au fond que la proposition à démontrer traduite dans un autre langage.
On ne peut donc se soustraire à cette conclusion que la règle du raisonnement par récurrence est irréductible au principe de contradiction.
Cette règle ne peut non plus nous venir de l’expérience ; ce que l’expérience pourrait nous apprendre, c’est que la règle est vraie pour les 10, pour les 100 premiers nombres, par exemple ; elle ne peut atteindre la suite indéfinie des nombres, mais seulement une portion plus ou moins longue mais toujours limitée de cette suite.
Or, s’il ne s’agissait que de cela, le principe de contradiction suffirait ; il nous permettrait toujours de développer autant de syllogismes que nous voudrions ; c’est seulement quand il s’agit d’en enfermer une infinité dans une seule formule, c’est seulement devant l’infini que ce principe échoue ; c’est également là que l’expérience devient impuissante. Cette règle, inaccessible à la démonstration analytique et à l’expérience, est le véritable type du jugement synthétique a priori. On ne saurait d’antre part songer à y voir une convention, comme pour quelques-uns des postulats de la géométrie.
Pourquoi donc ce jugement s’impose-t-il à nous avec une irrésistible évidence ? C’est qu’il n’est que l’affirmation de la puissance de l’esprit qui se sait capable de concevoir la répétition indéfinie d’un même acte dès que cet acte est une fois possible. L’esprit a de cette puissance une intuition directe et l’expérience ne peut être pour lui qu’une occasion de s’en servir et parla d’en prendre conscience.
Mais, dira-t-on, si l’expérience brute ne peut légitimer le raisonnement par récurrence, en est-il de même de l’expérience aidée de l’induction ? Nous voyons successivement qu’un théorème est vrai du nombre 1. du nombre 2, du nombre 3 et ainsi de suite ; « la loi est manifeste », disons-nous, et elle l’est au même titre que toute loi physique appuyée sur des observations dont le nombre est très grand, mais limité.
On ne saurait méconnaître qu’il y a là une analogie frappante avec les procédés habituels de l’induction. Mais une différence essentielle subsiste. L’induction, appliquée aux sciences physiques, est toujours incertaine, parce qu’elle repose sur la croyance à un ordre général de l’Univers, ordre qui est en dehors de nous. L’induction mathématique, c’est-à-dire la démonstration par récurrence, s’impose au contraire nécessairement, parce qu’elle n’est que l’affirmation d’une propriété de l’esprit lui-même.
Les mathématiciens, je l’ai dit plus haut, s’efforcent toujours de « généraliser » les propositions qu’ils ont obtenues, et pour ne pas chercher d’autre exemple, nous avons tout à l’heure démontré l’égalité :
,
et nous nous en sommes servis ensuite pour établir l’égalité :
,
qui est manifestement plus générale.
Les mathématiques peuvent donc comme les autres sciences procéder du particulier au général.
Il y a là un fait qui nous aurait paru incompréhensible au début de cette étude, mais qui n’a plus pour nous rien de mystérieux, depuis que nous avons constaté les analogies de la démonstration par récurrence avec l’induction ordinaire.
Sans doute le raisonnement mathématique récurrent et le raisonnement physique inductif reposent sur des fondements différents, mais leur marche est parallèle ; ils vont dans le même sens, c’est-à-dire du particulier au général.
Examinons la chose d’un peu plus près.
Pour démontrer l’égalité :
(1)
îl nous suffit d’appliquer deux fois la règle
(2)
et d’écrire :
L’égalité (2) ainsi déduite par voie purement analytique de l’égalité (1) n’en est pas cependant un simple cas particulier : elle est autre chose.
On ne peut donc même pas dire que dans la partie réellement analytique et déductive des raisonnements mathématiques, on procède du général au particulier, au sens ordinaire du mot.
Les deux membres de l’égalité (2) sont simplement des combinaisons plus compliquées que les deux membres de l’égalité (1) et l’analyse ne sert qu’à séparer les éléments qui entrent dans ces combinaisons et à en étudier les rapports.
Les mathématiciens procèdent donc « par construction » ; ils « construisent » des combinaisons de plus en plus compliquées. Revenant ensuite par l’analyse de ces combinaisons, de ces ensembles, pour ainsi dire, à leurs éléments primitifs, ils aperçoivent les rapports de ces éléments et en déduisent les rapports des ensembles eux-mêmes.
C’est là une marche purement analytique, mais ce n’est pas pourtant une marche du général au particulier ; car les ensembles ne sauraient évidemment être regardés comme plus particuliers que leurs éléments.
On a attaché, et à juste titre, une grande importance à ce procédé de la « construction » et on a voulu y voir la condition nécessaire et suffisante des progrès des sciences exactes.
Nécessaire, sans doute, mais suffisante, non.
Pour qu’une construction puisse être utile, pour qu’elle ne soit pas une vaine fatigue pour l’esprit, pour qu’elle puisse servir de marchepied à qui veut s’élever plus haut, il faut d’abord qu’elle possède une sorte d’unité, qui permette d’y voir autre chose que la juxtaposition de ses éléments.
Ou plus exactement, il faut qu’on trouve quelque avantage à considérer la construction plutôt que ses éléments eux-mêmes.
Quel peut être cet avantage ?
Pourquoi raisonner sur un polygone par exemple, qui est toujours décomposable en triangles, et non sur les triangles élémentaires ?
C’est qu’il y a des propriétés appartenant aux polygones d’un nombre quelconque de côtés et qu’on peut appliquer immédiatement à un polygone particulier quelconque. Le plus souvent, au contraire, ce n’est qu’au prix des plus longs efforts qu’on pourrait les retrouver en étudiant directement les rapports des triangles élémentaires.
Si le quadrilatère est autre chose que la juxtaposition de deux triangles, c’est qu’il appartient au genre polygone.
Une construction ne devient intéressante que quand on peut la ranger à côté d’autres constructions analogues, formant les espèces d’un même genre.
Encore faut-il qu’on puisse démontrer les propriétés du genre sans être forcé de les établir successivement pour chacune des espèces.
Pour y arriver il faut nécessairement remonter du particulier au général, en gravissant un ou plusieurs échelons.
Le procédé analytique « par construction » ne nous oblige pas à en descendre ; mais il nous laisse au même niveau.
Nous ne pouvons nous élever que par l’induction mathématique qui seule peut nous apprendre quelque chose de nouveau. Sans l’aide de cette induction différente à certains égards de l’induction physique, mais féconde comme elle, la construction serait impuissante à créer la science.
Observons en terminant que cette induction n’est possible que si une même opération peut se répéter indéfiniment. C’est pour cela que la théorie du jeu d’échec ne pourra jamais devenir une science, puisque les différents coups d’une même partie ne se ressemblent pas.
- ↑ J’appelle ainsi, faute de dénomination meilleure, tout raisonnement de la
forme suivante :
Si la proposition est vraie, sera vraie ; or si est vraie, sera vraie ; donc si est vraie, sera vraie.
Ou bien encore :
Si est vraie, sera vraie ; or est vraie, donc est vraie.