Leçons sur l’intégration et la recherche des fonctions primitives (seconde édition)/Note

La bibliothèque libre.



NOTE.

SUR LES NOMBRES TRANSFINIS.



I. — Les ensembles dérivés.

Nous avons résoudre, à la fin du Chapitre I, la question suivante :

Une fonction continue est connue à une constante additive près, variant d’un intervalle à l’autre, dans tout intervalle ne contenant aucun des points d’un ensemble  ; quelle doit être la nature de l’ensemble pour que la fonction soit complètement déterminée[1] ?

Ce problème a été résolu par M. G. Cantor, qui l’utilisa dans la théorie des séries trigonométriques. Nous allons étudier les propriétés des ensembles qui ont été employées au Chapitre I pour la résolution de cette question.

Considérons un ensemble borné de points[2]. L’ensemble de ses points limites est son premier dérivé, il se note ou . Le dérivé de est le second dérivé, il se note  ; et ainsi de suite.

I. Pour tout ensemble infini (c’est-à-dire comprenant une infinité de points) existe, c’est le principe de Bolzano-Weierstrass. Pour le démontrer, rangeons en une classe tous les nombres qui ne sont supérieurs qu’à un nombre fini de nombres de et dans la classe les autres nombres. La coupure définit un nombre qui est évidemment un point limite de et même le plus petit de ses points limites.

est évidemment fermé, c’est-à-dire contient ses points limites, donc il contient son dérivé  ; est fermé, il contient  ; et ainsi de suite.

Ces ensembles , , , … peuvent exister. Un premier cas où leur existence est évidente est celui où est parfait, car alors , , , … sont tous identiques. Dans ce cas, la définition de , , … ne présente pas d’intérêt, nous conviendrons de ne jamais parler de dérivé pour un ensemble parfait. Mais ces ensembles peuvent être tous distincts. Voici le procédé de construction que nous emploierons pour le voir :

Soient des ensembles , , … situés sur (0, 1). Divisons (0, 1) en intervalles partiels , , , …. Effectuons sur la transformation homothétique qui remplace (0, 1) par  ; devient . La somme de ces ensembles et du point 0 sera notée .

Si , , …, se réduisent au point 0,

est un ensemble pour lequel se réduit au point 0. Si , , … sont identiques à on obtient pour lequel se réduit au point 0. Et ainsi de suite.

Si , , …, pour , les dérivés , , … contiennent tous des points.

II. Lorsque les dérivés , , … contiennent tous des points, il existe des points communs à tous ces dérivés. Soit, en effet, un point de  ; est aussi point de , , …, . L’ensemble , , … a au moins un point limite qui, étant limite des points , , … de , est point de . Ce point appartient donc à tous les [3].

L’ensemble des points dont l’existence est ainsi démontrée est appelé le dérivé .

Pour , contient le seul point 0. Pour

le dérivé de se réduirait au point 0. Le dérivé de se note , et plus généralement les dérivés successifs de , se notent , , …. Il ne faut attacher aucune importance à la forme particulière des indices ici employés ; il suffit d’imaginer qu’on emploie des symboles différents pour désigner les différents dérivés.

Nous dirons de deux dérivés d’un même ensemble que l’un d’eux vient après l’autre s’il est contenu dans cet autre. Avec cette convention les mots avant et après peuvent être employés comme dans le langage ordinaire.

Jusqu’ici nous avons utilisé cette définition : Lorsqu’un dérivé contient une infinité de points et n’est pas parfait, son dérivé est par définition le premier dérivé qui vient après lui. Une seconde définition est nécessaire ; pour la formuler, remarquons d’abord que si , , … sont des dérivés en nombre fini ou dénombrable, s’ils contiennent tous des points et s’ils sont différents deux à deux il existe des points qui leur sont communs à tous.

En effet, rangeons , , … en une suite finie ou simplement infinie, soit , , … cette suite. Nous pourrons comparer deux ensembles , à deux points de vue : soit en tant que dérivés, c’est-à-dire en considérant les indices supérieurs , , et nous emploierons alors les mots avant, et après pour énoncer les résultats de cette comparaison ; soit en tant que termes de la suite , , …, c’est-à-dire en considérant les indices inférieurs , , et nous emploierons alors les mots devant et derrière. Barrons dans les termes qui sont à la fois avant et derrière  ; nous obtenons , , , … Dans cette suite, barrons les termes qui sont à la fois avant et derrière , etc. Nous obtenons finalement une suite , , , … pour laquelle il y a accord entre les mots avant et devant, entre les mots après et derrière ; il en résulte que chacun des ensembles de cette suite contient tous ceux qui sont derrière lui et comme ces ensembles sont fermés il y a un ensemble fermé de points communs à tous les ensembles de . Tout point de cet ensemble est évidemment commun à tous les ensembles de et inversement puisque tout ensemble de fait partie de ou vient avant un ensemble de  ; pour la même raison ne serait pas changé si nous remplacions la suite par toute autre suite formée de dérivés de et telle que tout terme de l’une de ces suites appartienne à l’autre, ou soit avant un ensemble de cet autre.

À cause de ces faits, et par analogie avec la définition de , nous énonçons la proposition et la définition suivante :

III. Lorsque des dérivés d’un ensemble, en nombre fini ou dénombrable, contiennent tous des points, il existe des points communs à tous ces dérivés. L’ensemble de ces points, qui est évidemment fermé, est, par définition, le premier dérivé qui ne vient pas avant ceux donnés[4].

Pour que cette définition soit acceptable il faut que, si dans la suite il y avait un ensemble venant après tous les autres, ce soit à celui-ci que nous conduise notre définition. Or, il en est bien ainsi, car , venant après les autres, est contenu dans les autres, et il constitue donc bien l’ensemble des points communs à tous les ensembles de . Dans le cas que nous examinons en ce moment, la suite est limitée et inversement ; est le dernier terme de . Dans les autres cas, le dérivé défini est dit le premier dérivé venant après les dérivés donnés.

Par définition même, avant chaque dérivé il y a au plus une infinité dénombrable de dérivés.


II. — Les ensembles bien ordonnés. Les nombres transfinis.

Cantor dit qu’un ensemble d’éléments est ordonné s’il a été établi entre deux déments quelconques de cet ensemble une relation qui peut s’exprimer avec les mots avant et après ; ces mots étant soumis aux règles d’emploi usuelles. C’est-à-dire que si l’on dit est avant , cela entraînera : est après  ; que si l’on dit est avant qui est avant , cela entraînera : est avant .

Cantor dit qu’un ensemble est bien ordonné, s’il est ordonné de telle manière que, dans cet ensemble , et dans chaque ensemble partiel qu’on peut déduire de en supprimant des éléments, il y a un élément venant avant tous les autres.

Si l’on convient qu’avant signifie plus petit que, tout ensemble de nombres réels est ordonné, mais il n’est pas toujours bien ordonné. L’ensemble des nombres compris entre 0 et 1, l’ensemble des entiers positifs et négatifs ne sont pas bien ordonnés. Par contre, l’ensemble des nombres positifs, qui, dans le système décimal s’écrivent avec une suite non croissante de chiffres décimaux, c’est-à-dire l’ensemble des nombres

,

entier, les chiffres , , , … vérifiant les inégalités , est bien ordonné.

L’ensemble des ensembles , , …, , est bien ordonné quand on range les ensembles dans l’ordre où nous les avons obtenus ; il n’est qu’ordonné si on les range dans l’ordre inverse.

L’ensemble des dérivés d’un ensemble est bien ordonné : le mot avant ayant la signification indiquée, c’est-à-dire que le dérivé est avant le dérivé , si contient . En effet, est ordonné, il contient un élément avant tous les autres, le dérivé . Soit un ensemble partiel déduit de . Soit un dérivé situé dans  ; avant il y a au plus une infinité dénombrable de dérivés, l’ensemble des dérivés situés avant tous ceux de , contient donc au plus une infinité dénombrable d’éléments. Si est dans , n’existe pas ; dans ce cas admet l’élément qui est avant tous les autres. Si n’est pas dans , existe et il existe un dérivé de qui est le premier, venant après tous ceux de . Ce dérivé appartient à et il ne saurait y avoir dans de dérivé venant avant celui-ci ; est donc un élément de venant avant tous les autres. est bien ordonné.

Les ensembles de dérivés sont tels qu’avant chacun de leurs éléments il y a au plus une infinité dénombrable d’éléments ; nous ne nous occuperons que des ensembles bien ordonnés possédant cette propriété ; nous réserverons le nom de suite pour ces ensembles[5]. Les nombres transfinis que nous allons définir sont ceux qui servent à noter l’ordre des éléments de ces suites. Considérons une de ces suites  ; elle contient un élément venant avant tous les autres que nous appellerons le premier et que nous pourrons noter avec l’indice 1, . Puis, si ne se réduit pas à , la suite , aura un premier élément qu’on appellera le deuxième élément de et qu’on notera . Si existe, on en déduira l’existence d’un troisième élément de , etc.

La place dans la suite, des éléments ainsi rencontrés se caractérise donc à l’aide des adjectifs ordinaux habituels ou des entiers jouant le rôle de nombres ordinaux.

Mais si la suite n’est pas épuisée en même temps que la suite des entiers, il faudra utiliser de nouveaux symboles pour noter la place des éléments restants ; nous conviendrons de noter le premier élément de la suite , de noter le premier élément de. Ces nouveaux symboles sont appelés les nombres transfinis de la première classe numérique de nombres transfinis ; nous dirons seulement les nombres transfinis. En somme, les nombres transfinis sont les indices différents que nous imaginions tout à l’heure utilisés pour distinguer les dérivés successifs, ils servent pour toutes les suites[6]. Les éléments des suites seront donc notés , étant un nombre fini ou transfini. Les nombres forment eux-mêmes une suite, quand on convient de dire que est avant , quand sert à noter un élément qui vient avant celui noté à l’aide de . Par analogie avec le cas où les nombres sont finis — et où par suite ces nombres ont à la fois une signification ordinale et cardinale, — on dit aussi que est plus petit que , et l’on écrit , quand est avant .

Pour constituer la suite des nombres transfinis, il suffirait de donner un procédé permettant de former le nombre qui vient immédiatement après un nombre fini ou dénombrable de nombres finis ou transfinis donnés. On pourrait convenir, par exemple, que le nombre suivant , , … se notera . Avec cette convention, il y aurait plusieurs notations pour le même nombre, mais peu importe. Il est bien clair aussi que l’écriture des symboles avec cette convention serait impossible puisqu’elle nécessiterait une infinité de traits ; laissons de côté cette question d’une numération pour les nombres transfinis, elle est accessoire pour nous ; nous y reviendrons d’ailleurs plus loin.

IV. L’ensemble des nombres transfinis n’est pas dénombrable. — En effet, s’il était dénombrable, il suffirait d’ajouter à la suite des nombres finis et transfinis un nouveau symbole, que l’on conviendrait de placer après tous ceux de , pour obtenir une suite dont la place du dernier élément ne pourrait être notée avec les symboles constituant . Ainsi est non dénombrable ; mais avant tout élément de il n’y a qu’une infinité dénombrable de nombres, au plus.

Ce fait est tout à fait analogue au suivant : la suite des nombres entiers est telle qu’avant tout élément de il n’y a qu’un nombre fini de nombres ; mais, comme l’addition d’un élément à toute suite finie donne une suite finie, la suite n’est pas finie.

Au cours de ces considérations, nous avons admis à plusieurs reprises comme évident, que le numérotage des éléments d’une suite ordonnée à l’aide des symboles successifs de , ne pouvait se faire que d’une façon. Par exemple, nous avons considéré comme clair que si l’on numérote les éléments de en tant que termes d’une suite avec les éléments de en tant que nombres, chaque élément est identique au nombre qui fixe son rang. On peut, sinon rendre ces faits plus clairs, du moins les présenter sous une forme à laquelle on est plus habitué, en disant :

Faisons correspondre les éléments de deux suites et de manière que les deux premiers éléments de et se correspondent et que, si les premiers éléments en nombre fini ou dénombrable de , soient , , …, correspondent aux premiers éléments , , … de , le premier élément de après , , … corresponde au premier élément de , après , , … ; si ces deux éléments existent.

Montrons que cette correspondance est bien déterminée. En effet, il y a des éléments de pour lesquels la correspondance est déterminée ; le premier élément de , par exemple. Considérons l’ensemble de tous les éléments de pour lesquels la correspondance est déterminée ainsi que pour tous les éléments antérieurs. Alors, s’il restait encore des éléments dans et dans , la correspondance, d’après sa définition même, serait encore déterminée pour le premier élément de après . Ceci serait en contradiction avec la définition de  ; donc la correspondance est entièrement déterminée et épuise ou , ou les deux. Dans ce dernier cas, on dit que les suites sont semblables.

Dans le cas où est la suite des nombres transfinis, il y aurait contradiction à supposer que la correspondance épuise sans épuiser  : Toute suite est semblable à ou semblable à un segment de . (Par un segment d’une suite, on entend tous les éléments qui précèdent un élément donné).

Toutes les suites non finies que nous rencontrerons, sauf , seront dénombrables ; elles seront donc semblables à un segment de . Or, un segment de est entièrement déterminé par le nombre qui le suit ; à chaque suite dénombrable nous pouvons attacher un nombre transfini qui nous fait connaître les nombres finis et transfinis nécessaires au numérotage des éléments de . Ce nombre nous donne ainsi un renseignement extrêmement important sur , mais ne nous permet naturellement pas de distinguer entre et les suites semblables puisque, par définition, est le même pour toutes les suites semblables. Car il résulte immédiatement du fait que la correspondance entre les éléments successifs de deux suites est déterminée, que si est semblable à et à , est semblable à et que la correspondance établie directement entre les éléments de et est en accord avec celle qu’on pourrait établir par l’intermédiaire de .

Ce nombre est dit le type d’ordre de la suite dénombrable  ; il nous donne sur des renseignements exactement analogues à ceux que nous connaissons sur une suite finie quand nous savons qu’elle contient 10 éléments[7]. C’est comme types d’ordre que G. Cantor a introduit les nombres transfinis[8].

Il y a lieu de faire, entre les divers nombres transfinis, une différence essentielle. Les uns, ceux qui sont dits de première espèce, suivent immédiatement un nombre transfini, c’est-à-dire qu’ils sont les types d’ordre de suites ayant un dernier terme, les autres sont dits de deuxième espèce. Si est de première espèce, il y a un nombre transfini que l’on peut noter  ; cette notation ne s’applique à aucun nombre, si est de seconde espèce. est de seconde espèce, est de première espèce.


III. — Les ensembles de points.

Nous venons de concevoir logiquement un ensemble de nombres finis transfinis qui est dénombrable ; mais il n’est pas certain que cet ensemble soit tout entier utile. Montrons donc, par des exemples, qu’un segment de ne peut suffire, ni pour numéroter tous les dérivés des ensembles de points, ni pour fournir les types d’ordre de toutes les suites de points. Ces exemples ne seront pas effectivement construits ; on montrera seulement qu’il y aurait absurdité à admettre qu’on sera arrêté au cours de la construction de ces exemples. G. Cantor a fréquemment utilisé ce procédé de preuve.

Supposons donc que nous ayons construit des ensembles , , …, , , …, pour lesquels les dérivés se numérotent respectivement à l’aide des segments de dont le dernier terme est le nombre 1, le nombre 2, …, le nombre , le nombre , …. Et ceci pour tous les nombres d’un certain segment de . Si est le premier terme de la suite après , nous voulons construire un ensemble pour lequel le numérotage des dérivés exige tous les nombres de jusques et y compris .

Si est de première espèce, c’est-à-dire si existe, nous prendrons  ; si est de seconde espèce, c’est-à-dire si n’existe pas, rangeons tous les nombres de en suite simplement infinie, soit , , , … cette suite ; nous prendrons

.

On vérifie de suite que l’ensemble ainsi construit répond à la question : en effet, dans le premier cas le dérivé d’ordre se compose des points 1/2, 1/4, 1/8, … et du point 0 ; dans le second, si , est le plus grand des nombres , , …, , il n’y a plus de points du dérivé d’ordre dans et il y en a encore dans  ; étant le premier nombre transfini qui vient après tous les nombres , le dérivé d’ordre existera et se réduira au point 0[9].

Convenons que « avant » signifie plus petit que et montrons que l’on peut obtenir une suite de points, situés sur (0, 1), qui soit de type ordinal donné. On connaît des suites finies et des suites simplement infinies, c’est-à-dire de type . On pourra prendre comme exemple de ces dernières suites, la suite constituée par les points dont les abscisses sont les sommes successives de la série

.

Si l’on connaît une suite de type , on prendra comme suite de type celle qui est obtenue en prenant, par rapport à 0, l’homothétique, dans le rapport 1/2, de la suite constituée par plus le point 1.

Si l’on connaît des suites , , …, de types d’ordre , , , …, si la suite simplement infinie , , … ne contient pas un terme plus grand que les autres et si est le premier nombre transfini après , , …, formons une suite à l’aide de suites , , …. La suite étant directement semblable à , et contenue à l’intérieur du ième intervalle déterminé dans (0, 1) par les points de .

Il est clair que cette suite a un type d’ordre supérieur à , , … ; donc, si l’on numérote les éléments successifs à l’aide des nombres de , on rencontrera un segment de , qui pourra être lui-même, dont le numérotage exige tous les nombres inférieurs à . C’est ce segment qui est la suite , de type d’ordre , que nous voulions obtenir.

Ainsi la suite tout entière est indispensable pour l’une ou l’autre des utilisations dont nous avons parlé. Mais nous allons voir qu’un segment de suffit toujours pour le numérotage des éléments d’un ensemble bien ordonné de points déterminé et aussi pour le numérotage des dérivés successifs d’un ensemble déterminé. Le premier fait est évident, il résulte de ce que tout ensemble bien ordonné de points sur une droite est dénombrable ; en effet, si l’on compte les abscisses de ces points à partir du premier d’entre eux et dans le sens ou se succèdent les points, la transformation remplace l’ensemble bien ordonné donné par un ensemble de points de (0, 1) bien ordonné dans le sens décroissant. Chaque point de est l’extrémité d’un intervalle dont l’origine est le point de d’abscisse immédiatement inférieure à celle de . On a donc autant de ces intervalles que de points  ; ces intervalles sont non empiétants, il y a donc au plus de longueur non inférieure à et cela quel que soit  ; donc l’ensemble de ces intervalles est fini ou dénombrable ; l’ensemble proposé est dénombrable au plus.

L’autre fait est bien autrement caché. Il est le résultat de l’analyse faite par Cantor des propriétés des dérivés. Dans ce paragraphe, sans suivre pas à pas les considérations de Cantor, nous ne nous écarterons pas essentiellement des idées qui l’ont guidé.

V. Les points de qui ne font pas partie de , (), forment un ensemble dénombrable. — En effet, les points de qui ne font pas partie de sont isolés dans  ; chacun d’eux peut donc être enfermé dans un intervalle ne contenant pas d’autre point de et l’on peut prendre ces intervalles sans points communs. Donc ces intervalles forment au plus une infinité dénombrable ; les points de qui ne font pas partie de forment donc un ensemble fini ou dénombrable.

De même les points de ne faisant pas partie de forment un ensemble fini ou dénombrable. Or, l’ensemble dont parle l’énoncé est la somme des pour les valeurs de inférieures à , lesquelles sont en nombre fini ou dénombrable ; donc cet ensemble est lui-même fini ou dénombrable.

On peut d’ailleurs dire aussi que les points de qui ne font pas partie de forment un ensemble fini ou dénombrable, car le même raisonnement qui nous a montré que les ensembles sont au plus dénombrables prouve qu’il en est de même pour l’ensemble des points de ne faisant pas partie de . De là il résulte que tout ensemble de points dont l’un des dérivés ne contient aucun point est au plus dénombrable. Ces ensembles sont appelés ensembles réductibles. Ce sont des ensembles dénombrables particuliers : l’ensemble des nombres rationnels est dénombrable, mais n’est pas réductible.

Lorsqu’un ensemble n’est pas réductible, deux cas sont, a priori, possibles. Ou bien, au cours des opérations de dérivation, on arrive à un ensemble dérivé qui est parfait et alors, suivant nos conventions, nous arrêtons à cet ensemble nos opérations de dérivation, c’est-à-dire que nous ne considérons que les dérivés différents , , …, . Ou bien, les opérations de dérivation donneront toujours des dérivés différents, on aurait un ensemble non dénombrable semblable à de tels dérivés. Nous allons voir que ce cas ne se présente pas.

Considérons l’ensemble des dérivés de , qui existent effectivement, c’est-à-dire contiennent des points, et qui ne sont pas parfaits, à l’exception peut-être du dernier. Ils sont tous différents. Soient , , … les intervalles contigus à , rangés en suite simplement infinie. Soit celui des intervalles contigus à qui contient . Soit l’accroissement de longueur quand on passe de à . Certains des sont nuls ; mais, pour chaque valeur de , certains des sont différents de zéro, puisque est toujours différent de  ; si n’existait pas, on prendrait pour l’intervalle .

Or il ne peut, pour donné, y avoir qu’une infinité dénombrable au plus de valeurs différentes de zéro, car la longueur de ne peut croître au delà de celle de la longueur de l’intervalle contenant l’ensemble donné[10]. Et comme ceci est vrai pour chaque valeur entière de , l’ensemble de tous les différant de zéro est au plus dénombrable. L’ensemble des termes de est donc dénombrable[11], donc :

VI. Tout ensemble de points a soit un dérivé qui ne contient aucun point, soit un dérivé parfait.

VII. Tout ensemble fermé est la somme d’un ensemble fini ou dénombrable et d’un ensemble parfait ; l’un ou l’autre de ces ensembles peut ne pas exister.

En effet, un ensemble fermé est contenu dans son dérivé et celui-ci est la somme d’un ensemble dénombrable au plus et de son dernier dérivé, nul ou parfait.

Ces deux théorèmes constituent la propriété connue sous le nom de théorème de Cantor-Bendixson[12]. Pour donner à la décomposition indiquée par ce théorème toute sa valeur, il faut évidemment remarquer que tout ensemble parfait est non dénombrable ou, d’une façon plus précise, a la puissance du continu. Ceci est évident s’il s’agit d’un ensemble contenant un intervalle ; supposons donc que soit un ensemble parfait partout non dense, dont nous désignons par et les points extrêmes. Or nous avons associé (p. 13) à un tel ensemble une fonction continue, constante dans tout intervalle contigu à , croissante dans tout intervalle contenant des points de et qui varie de 0 à 1 quand varie de à . L’équation admet pour chaque valeur de comprise entre 0 et 1 soit une seule solution , est alors l’abscisse d’un point de , soit une infinité de solutions données par une double inégalité , alors et sont les abscisses des deux extrémités d’un intervalle contigu à . Ainsi à chaque valeur de (0, 1), nous faisons correspondre soit un point de , soit deux points et de  ; a donc la puissance du continu.

Notons aussi que le raisonnement de la page 323 prouve que : toute suite d’ensembles fermés tous différents, tels que chacun d’eux contienne ceux qui viennent après lui dans la suite, est nécessairement finie ou dénombrable.


IV. — Une notation des nombres transfinis nous est-elle nécessaire ?

Dans le cours de ce livre, nous faisons plusieurs fois appel à la notion de nombre transfini ; il importe donc d’éclaircir cette notion et d’amener, si possible, le lecteur à cette conviction qu’il lui suffirait de se familiariser avec la suite des nombres transfinis en l’utilisant fréquemment pour acquérir de cette suite une vue aussi claire que celle qu’il a de la suite des entiers[13].

Quand on entend parler pour la première fois de la suite , des nombres finis et transfinis, on croit volontiers que tout deviendrait net, si l’on avait une notation des nombres transfinis. Or il est clair qu’on n’en saurait avoir une : nous ne pouvons manier qu’un nombre fini de symboles ou de sons et les combiner seulement d’un nombre fini de manières, ce qui ne donne jamais qu’un nombre fini de notations. Ce nombre pourra être grand ; cela dépendra du nombre des symboles, de leur choix plus ou moins heureux, de l’ingéniosité des lois de combinaisons prévues ; mais il sera toujours fini. Toute numération s’appliquant à un ensemble infini de nombres est, à certains égards, fictive.

Examinons, par exemple, la numération décimale appliquée aux nombres compris entre 0 et 1 ; elle a la prétention de nous permettre de noter tout nombre. Pour cela elle utilise une suite indéfinie de chiffres 0, , , , …. Mais une telle suite ne peut jamais être ni écrite, ni énoncée. Il y a quelques cas heureux dans lesquels nous pouvons énoncer la loi de succession des chiffres décimaux , , , … de et cette loi détermine  ; le plus souvent, tout ce que nous pouvons dire se réduit à ceci : la suite 0, , , , … est déterminée par le nombre . On voit à quel point la notation décimale des nombres de (0, 1) est illusoire en tant que notation.

Examinons encore la numération des entiers. Elle est hautement pratique et commode pour les usages usuels et constitue un progrès considérable sur les procédés de l’Arénaire, bien que ceux-ci soient déjà très puissants et d’ailleurs voisins de nos procédés actuels.

Mais, pas plus que les procédés de l’Arénaire, elle ne permet de noter tous les nombres, elle nous convainc seulement, comme l’Arénaire, que si grand que soit un nombre on réussira à établir des conventions assez ingénieuses pour qu’on arrive à noter ce nombre et les nombres plus petits.

La numération ne nous permettrait de noter tous les nombres que si nous pouvions répéter le même acte (écrire un chiffre, énoncer un chiffre) un nombre quelconque arbitrairement grand de fois : mais alors nous pourrions tracer autant de barres, ou prononcer autant de fois le son un, qu’il y a d’objets dans la collection finie à dénombrer. Nous n’avons donc résolu le problème de la notation des nombres qu’en nous plaçant dans une hypothèse où ce problème ne se pose en réalité plus[14].

Il est bien clair que, de même, la notation des nombres transfinis serait immédiate pour celui qui pourrait répéter le même acte une infinité bien ordonnée et dénombrable de fois de type d’ordre quelconque.

Malgré tout, nos habitudes sont telles que nous désirons un simulacre de notation ; fût-il simplement conçu, pratiquement irréalisable, c’est-à-dire entièrement illusoire. Avoir pu noter les premiers nombres transfinis , , …, , , …, , …, , … nous aide déjà.

Soit un nombre entre 0 et 1, écrivons-le dans le système décimal ; nous supposons ce développement indéfini, soit 0, , , , , …. Posons

Si tous les nombres sont différents, si l’ensemble de ces nombres est ordonné dans le sens des croissants, par exemple, convenons de dire que note le type d’ordre de cet ensemble.

Ce que nous avons fait au paragraphe précédent relativement à la construction de suites d’ordre montre que tout nombre transfini est noté par certains points , mais cette notation est très imprécise : au même nombre correspond une infinité de points . Pour que cette notation se rapproche par ses propriétés des notations ordinaires il faudrait qu’à chaque nombre transfini nous ayons pu attacher une suite bien déterminée[15], donc un nombre bien déterminé[16].

On est ainsi conduit à se demander s’il est possible de nommer un ensemble pris dans (0, 1) et tel qu’il existe une correspondance biunivoque entre les points de et les nombres de . Ce problème a préoccupé bien des mathématiciens ; on a affirmé plusieurs fois qu’on pouvait prendre pour l’intervalle (0, 1) lui-même. Mais la question est loin d’être élucidée[17]. Pour nous, d’ailleurs, tout ceci est accessoire, car il est clair que ce mode de représentation des nombres transfinis ne nous aiderait guère à les bien concevoir.

Pourtant cette pseudo-notation remplit l’une des conditions essentielles d’une notation. À quoi sert, en effet, la numération des entiers ? Elle n’intervient jamais dans les raisonnements, sauf bien entendu, ceux qui concernent la numération elle-même ; mais elle permet de caractériser le nombre dont on veut parler, s’il n’est pas trop grand, c’est-à-dire qu’elle permet de construire, qu’elle détermine, un ensemble bien ordonné fini semblable à celui dont on s’occupe. Quand on nous parle du nombre 3, nous savons qu’il va s’agir d’ensembles semblables à celui-ci : III, et quand nous raisonnons sur le nombre trois, nous faisons des raisonnements s’appliquant à tous les ensembles bien ordonnés semblables à cet ensemble de traits. Toutes les fois que nous raisonnons sur un entier, donné de quelque manière que ce soit, nous sommes dans des circonstances analogues.

Dès lors, il est clair que nous pourrions nous passer de la notion et du mot nombre ; la notion plus tangible de suite ordonnée et finie d’objets nous suffirait. Exactement de la même manière, supposer un nombre transfini donné c’est supposer déterminé un ensemble bien ordonné dénombrable ; raisonner sur ce nombre, c’est faire des raisonnements s’appliquant indifféremment à tous les ensembles semblables à celui-ci. La notion et le mot de nombre transfini nous sont donc inutiles ; celle d’ensemble bien ordonné dénombrable nous suffit.

Au fond, les obscurités que nous croyions apercevoir dans la notion de nombre transfini sont peut-être déjà dans la notion d’entier fini, quand on veut y voir une entité métaphysique, donc peu claire. G. Cantor dit[18] : Nous appelons puissance ou nombre cardinal d’un ensemble , la notion générale que nous déduisons de à l’aide de notre faculté de penser, en faisant abstraction de la nature des différents éléments de et de leur ordre.

Et, pour lui, un type d’ordre est la notion générale qui résulte de lorsque nous faisons abstraction de la nature des éléments de , mais non de leur ordre de succession.

Il paraît difficile de trouver sous ces définitions philosophiques autre chose que les remarques qui précèdent, et dès lors ces définitions se réduisent à une convention de langage : quand nous emploierons le mot nombre, nous rappellerons par là que nous raisonnons sur un ensemble, mais en n’employant que des raisonnements applicables tout aussi bien à tous les ensembles semblables à celui considéré.

La définition des nombres finis et transfinis est ainsi vidée de son contenu métaphysique et ne présente plus d’obscurité. Il est vrai que nous avons montré en même temps que l’emploi du mot nombre est inutile ; mais nous sommes habitués à employer les mots nombres entiers, il nous sera commode d’employer aussi les mots nombres transfinis, ce que nous savons pouvoir faire sans inconvénient[19].

En résumé, quand nous parlerons d’un nombre transfini, c’est que nous nous occuperons d’une suite, c’est-à-dire d’un ensemble bien ordonné dénombrable, définie seulement à une similitude près.


V. — Le raisonnement par récurrence transfinie.

Comment pourra-t-on obtenir une propriété des nombres transfinis ?[20] Pour répondre à cette question, examinons comment on obtient une propriété valable pour tous les entiers. C’est toujours en utilisant à quelque endroit le raisonnement par récurrence.

Ce mode de raisonnement est parfaitement convaincant[21] ; il est constamment utilisé par les mathématiciens, il ne saurait être question pour nous d’élever le moindre doute sur sa validité. Du fait, que nous allons rappeler, que le raisonnement par récurrence n’est pas réductible au raisonnement syllogistique, nous conclurons donc simplement que le raisonnement syllogistique n’est pas le seul qui puisse être utilisé en mathématique.

Supposons démontré : 1o  qu’une propriété est vraie pour le nombre un, 2o  que si la propriété est vraie d’un nombre, elle est vraie pour le suivant. Ceci étant, démontrons la propriété pour le nombre 3. Nous dirons :

La propriété est vraie pour un ; or la propriété est vraie pour un nombre lorsqu’elle est vraie pour le précédent, donc la propriété est vraie pour le nombre deux qui suit un.

La propriété est vraie pour deux ; or la propriété est vraie pour un nombre lorsqu’elle est vraie pour le précédent, donc la propriété est vraie pour le nombre trois qui suit deux.

Ainsi il nous a fallu, pour atteindre le nombre trois, répéter deux fois un raisonnement réductible, lui, aux syllogismes.

Pour obtenir la propriété pour tous les nombres, il nous faudrait faire une infinité de syllogismes. Il est vrai qu’on peut raisonner par l’absurde : si la propriété n’était pas vraie pour tous les nombres, on pourrait trouver un nombre pour lequel elle ne serait pas vérifiée ; alors, en descendant l’échelle des nombres depuis pour lequel n’a pas lieu jusqu’à un pour lequel a lieu, on rencontrerait deux nombres et tels que ait lieu pour et n’ait pas lieu pour , or ceci est contradictoire.

Mais, si l’on examine ce raisonnement, on voit que la recherche de se fera ainsi : si la propriété n’est pas vraie pour tous les nombres, ou elle est fausse pour un ou pour un nombre plus grand que un ; puis, si elle est vraie pour un, elle est fausse pour deux ou pour un nombre plus grand que deux, etc. La recherche de se fera par récurrence et grâce à une proposition dont l’exactitude n’est prouvée que par l’absurdité qu’il y aurait à admettre que l’on ait épuisé la suite des entiers sans rencontrer . L’affirmation de l’existence de , sur laquelle nous avons basé notre démonstration par l’absurde, n’est donc elle-même légitimée ainsi, que par l’absurde et grâce à une infinité actuelle de syllogismes[22].

Nous n’avons donc pas légitimé le procédé de preuve par récurrence à l’aide d’un raisonnement syllogistique. Il est bien clair que toute légitimation de cette nature est impossible, car nous n’avons construit la suite des nombres entiers qu’en admettant que nous pouvions envisager la répétition de la même opération, savoir l’adjonction d’un élément, un nombre arbitrairement grand de fois ; nous ne pouvons espérer explorer le domaine ainsi construit qu’en considérant comme possible la répétition du même raisonnement un nombre arbitrairement grand de fois, c’est-à-dire précisément en raisonnant par récurrence.

Notre premier essai de légitimation du raisonnement par récurrence à l’aide de syllogismes donne donc un résultat aussi heureux qu’on pouvait l’espérer puisqu’il nous donne le moyen de vérifier , pour chaque nombre particulier, à l’aide d’un nombre fini de syllogismes[23] ; sans doute, si vite que l’on aille à débiter ces syllogismes, il y aura des nombres assez grands pour que nous ne puissions faire pour eux la démonstration effectivement ; mais il nous est facile de concevoir que, chaque fois qu’on aura réussi à nommer un nombre , c’est-à-dire chaque fois qu’on aura su réaliser l’adjonction fois de suite d’un élément pour former l’ensemble de objets considérés, on pourra trouver le moyen de répéter fois le raisonnement récurrent, comme il est nécessaire de le faire pour vérifier la propriété pour le nombre . Au reste, pour le mathématicien, ce n’est pas la démonstration qui crée la vérité d’une proposition, elle permet seulement de constater cette vérité. Nous pouvons donc ne pas avoir ici les mêmes exigences que nous avions lorsqu’il s’agissait d’une notation, et nous contenter d’une démonstration conçue par le même procédé qu’est conçue la suite elle-même des entiers.

En résumé, la construction d’un segment fini de la suite des entiers n’exige que l’emploi de ce qu’on peut appeler une récurrence finie, la démonstration d’une propriété pour tous les nombres de ce segment exige seulement un raisonnement par récurrence finie, réductible aux syllogismes ; la construction de la suite complète des entiers exige un procédé de récurrence indéfinie et la démonstration d’une propriété pour tous les entiers exige le raisonnement par récurrence indéfinie qu’on ne pourrait remplacer que par une suite indéfinie de syllogismes.

Dès lors, il est clair que, pour démontrer une proposition pour la suite des nombres transfinis, il faut utiliser un mode de raisonnement qui permette de suivre pas à pas le procédé de formation de cette suite. Ce raisonnement est appelé le raisonnement par récurrence transfinie ; il exige que l’on prouve : 1o  qu’une propriété est vraie pour le nombre un (ou pour le nombre , suivant qu’on envisage tous les nombres finis et transfinis ou seulement les nombres transfinis) ; 2o  que, si la propriété est vraie pour tous les nombres inférieurs à un nombre , elle est vraie pour le nombre .

Cette deuxième partie du raisonnement par récurrence est le plus souvent remplacée par deux démonstrations distinctes ; on ne prouve l’énoncé du no 2 précédent que pour de seconde espèce et, pour de première espèce, on montre que, si la propriété est vraie pour , elle est vraie pour .

Sous l’une ou l’autre forme, le raisonnement par récurrence transfinie conduirait à la vérification syllogistique de la proposition, pour un nombre quelconque, si l’on admettait que l’on peut répéter un raisonnement une suite bien ordonnée et dénombrable quelconque de fois.

Les liens entre ce mode de raisonnement et le raisonnement syllogistique sont donc encore étroits, mais nous sommes pourtant très loin du raisonnement ordinaire puisque, au moins pour de seconde espèce, la seconde partie de notre raisonnement est basée sur la connaissance d’une infinité actuelle de prémisses[24].

On peut, comme nous l’avons déjà fait, expliquer pourquoi nous regardons une propriété comme démontrée pour tous les nombres transfinis par le raisonnement par récurrence transfinie en disant : si la propriété n’était pas vraie pour tous les nombres transfinis, il existerait des nombres pour lesquels elle ne serait pas vraie, la suite de ces nombres comprendrait un élément plus petit que tous les autres ; la propriété serait vraie pour tous les nombres inférieurs à , fausse pour , ce qui serait contradictoire.

Mais on ne saurait considérer ceci comme une justification du raisonnement par récurrence transfinie. Ce mode de raisonnement est nouveau, irréductible aux autres, et c’est précisément pour cela qu’il est puissant et utile.

Mais est-on obligé d’accepter ce mode de démonstration ? Nullement ; c’est à chacun de décider s’il est ou non entièrement satisfait par le raisonnement par récurrence transfinie. Seulement, de même qu’à peu près tout en mathématiques n’a été écrit que pour ceux qui admettent le raisonnement par récurrence ordinaire, certains passages de ce livre ne sont écrits que pour ceux qui admettent le raisonnement par récurrence transfinie.

Même si l’on se sent convaincu par les démonstrations par récurrence transfinie, on peut ne pas les aimer, désirer s’en passer ou vouloir délimiter ce que serait le domaine des mathématiques sans ce mode de démonstration. C’est pourquoi nous examinerons certains moyens d’éviter l’emploi de la récurrence transfinie.


VI. — Examen de quelques raisonnements par récurrence transfinie.

Dans le corps de ce livre, nous avons utilisé les nombres transfinis de trois manières différentes : d’abord en faisant usage du théorème de Cantor-Bendixson, puis en employant les chaînes d’intervalles, enfin à l’occasion des travaux de MM. Baire et Denjoy. Examinons ces utilisations et d’abord l’emploi des chaînes.

Supposons donné dans un ensemble bien ordonné de points ; bien ordonné dans le sens des croissants, par exemple. Numérotons-en les points , , …, , , … et supposons que chaque point dont l’indice est de seconde espèce soit point limite de l’ensemble des points d’indices plus petits. Alors nous disons que la division de à l’aide des points considérés est une chaîne d’intervalles.

Une telle chaîne nous servira à évaluer l’accroissement d’une fonction par la formule

,

mais il convient d’expliquer le sens du second membre[25].

Supposons connus des nombres , , … affectés, comme indices, de tous les nombres de la suite inférieurs à un certain nombre . La suite ordonnée de ces nombres est alors de type d’ordre [26]. Le symbole , représente une série transfinie de type d’ordre . Posons

 ;

les sont dits les séries partielles de . Les , en tant que nombres, ont un sens pour fini ; pour on convient que , en tant que nombre, n’existe que si la série ordinaire est convergente et qu’il est alors égal à la somme de cette série. Les nombres ainsi définis, pour , sont des sommes partielles de . Pour prolonger la définition de ces nombres à tout indice au plus égal à , convenons que l’on aura, pour tout de première espèce

,

et que, pour tout de seconde espèce, désignera la limite, si elle existe, vers laquelle tend toute suite , , … simplement infinie et relative à des nombres , , … croissants et définissant comme le plus petit nombre qui leur soit supérieur.

Lorsque ces définitions s’appliquent à toutes les valeurs de au plus égales , , la série transfinie est dite convergente et sa somme est le nombre qui vient d’être défini. La convergence d’une série de type d’ordre exige donc l’existence d’une limite déterminée pour chaque nombre de seconde espèce, au plus égal à .

Pour la série

,

relative à une fonction continue , dans laquelle on a supposé , et dans laquelle on remplace par zéro quand est de seconde espèce, il est clair que :

1o  On a

 ;

2o  Que si l’on a

,

on a

3o  Que si l’on a

pour tous les nombres inférieurs à un nombre de seconde espèce et si l’on prend une suite croissante de nombres définissant comme premier nombre supérieur auquel cas les points tendent en croissant vers , on a, à cause de la continuité de ,

.

D’où, par récurrence transfinie, on voit que la série est convergente et de somme

.


Voici, relativement aux séries transfinies, deux propositions dont on utilise fréquemment des cas particuliers dans l’analyse classique, par exemple pour la transformation d’une série ordinaire en série à double entrée.

Dans une série transfinie convergente, on peut grouper n’importe comment les termes consécutifs et considérer comme effectuées les sommations partielles ainsi mises en évidence. En d’autres termes, si l’on a

,

les constituant une suite finie, simplement infinie ou transfinie de type d’ordre on a, si la première série est convergente,

.

Ce théorème résulte de suite de l’égalité

pour  ;

que l’on vérifiera facilement.

Si, en remplaçant les termes d’une série transfinie par leurs valeurs absolues, on obtient des sommes partielles bornées dans leur ensemble, la série est convergente ; elle reste convergente dans quelque ordre (bien ordonné) que l’on range ses termes, et sa somme ne dépend pas de cet ordre.

On peut démontrer cette propriété de bien des manières par récurrence transfinie ; mais rappelons à son occasion que l’on peut toujours masquer l’emploi de cette récurrence grâce à un raisonnement par l’absurde.

Il nous suffit évidemment de montrer que si l’on range en une série (simplement infinie) les termes d’une série transfinie de la nature indiquée dans l’énoncé, c’est-à-dire absolument convergente, chaque somme partielle

existe et est égale à la somme de la série obtenue en barrant dans les termes qui ne figurent pas dans . Ceci a lieu à coup sûr pour  ; si ceci n’avait pas lieu pour toute valeur de , il y aurait une première valeur pour laquelle la proposition ne serait pas vraie. Or supposons que soit de première espèce ; on a alors

mais

,,

d’où

,

ce qui est en contradiction avec la définition de .

Supposons donc de seconde espèce. Alors pour on a

 ;

d’ailleurs est une série partielle déduite de en y barrant des termes, et tout terme de appartient à dès que est assez grand, donc si la suite simplement infinie

définit comme premier nombre supérieur à tous les , tend vers et par suite on a

 ;

c’est la même contradiction que précédemment.

La démonstration du théorème nous montre que, quand une suite transfinie est supposée formée, nous pourrons raisonner sur elle, grâce au raisonnement par l’absurde, sans faire à nouveau appel, apparemment du moins, à un procédé de récurrence transfinie.

Mais, dans le cas des chaînes transfinies, on peut aller plus loin. Dire qu’il est absurde qu’il y ait un premier nombre transfini à partir duquel une propriété n’a pas lieu, c’est alors dire qu’il y a, parmi les intervalles , un premier intervalle pour lequel une certaine propriété n’a pas lieu.

Et si l’on a réussi à mettre cette propriété sous une forme telle qu’elle appartienne à dès qu’elle appartient à un , avec , nous sommes ramenés à démontrer qu’une certaine propriété a lieu pour un intervalle dès qu’elle a lieu pour tout , avec . Nous n’avons plus à nous servir ni de la chaîne, ni de la récurrence transfinie, nous raisonnons sur le continu.

La première transformation de cette nature que l’on ait fait subir à une démonstration où intervenait le transfini, est sans doute celle qui a permis de déduire le raisonnement de la page 112 d’un raisonnement de M. Borel que l’on peut résumer ainsi : Nous avons une infinité[27] d’intervalles telle que chaque point de soit intérieur au sens strict à l’un d’eux au moins. Choisissons un intervalle contenant à son intérieur, un intervalle contenant à son intérieur, un intervalle contenant , etc. Si l’on n’atteint pas ainsi , il y a un point, appelons-le , qui est la limite des points . Choisissons un intervalle contenant , etc. Il est clair qu’on définit ainsi, par les , une chaîne d’intervalles couvrant . Or il est clair que peut être couvert avec un nombre fini des intervalles  ; qu’il en est de même de puis que cet intervalle peut être couvert avec et certains, en nombres finis des . En continuant ainsi transfiniment on voit que peut être couvert à l’aide d’un nombre fini d’intervalles .

La transformation de ce raisonnement donne : L’intervalle peut être couvert à l’aide d’un nombre fini des , sans quoi il y aurait une valeur telle que ne puisse être ainsi couvert alors que le pourrait être, si petit que soit positif. Or ceci est impossible ; car il existe un intervalle contenant , et par suite, peut être couvert par cet intervalle joint à ceux qui permettent de couvrir  ; l’existence de la valeur est impossible. C’est le raisonnement de la page 112.

L’examen de cette transformation de raisonnement met bien en évidence les avantages et inconvénients de l’une et l’autre forme : sous la deuxième forme il est rapide, d’aspect habituel, il permet de mieux apercevoir les généralisations possibles, les hypothèses restrictives que l’on peut supprimer ; mais il ne donne plus qu’un théorème d’existence alors que, sous la première forme, il fournit un procédé opératoire pour le choix des , en nombre fini, propres à couvrir tout .

M. Borel, dès le début, insistait sur le fait que son raisonnement fournissait un « procédé régulier » pour « déterminer effectivement » les . Sans doute, on pourrait chicaner sur le mot effectivement ; faire observer qu’on ne saurait faire « effectivement » une opération qui comporte une infinité de stades[28], mais, à ce compte, on ne déterminerait pas effectivement une fonction quand on en aurait trouvé un développement en série. On peut, certes, se refuser à employer pour ce cas le mot effectivement ; mais n’est-ce pas déjà beaucoup que d’avoir résolu un problème aussi bien qu’est celui de la détermination d’une fonction quand on a su donner la loi des termes successifs de son développement en série ?

Les chaînes d’intervalles s’introduisent dans la recherche des fonctions primitives de la façon suivante : Soit la dérivée d’une fonction continue  ; il existe des intervalles , , … dans chacun desquels on a une inégalité de la forme

.

Ces intervalles, et ces inégalités, sont ceux que l’on considère dans la démonstration d’existence des solutions de l’équation  ; seulement on se place généralement dans des conditions où l’on peut couvrir tout l’intervalle considéré à l’aide d’un nombre fini de ces intervalles . Si l’on ne suppose rien sur les intervalles sont en nombre infini et ils forment une chaîne d’intervalles qu’on peut toujours utiliser pour l’évaluation approchée de à partir de la formule exacte

,

étant supposé contenu dans . De cette évaluation approchée de , on déduit alors que l’on a, avec certaines généralisations de l’intégrale,

,

comme conséquence de l’inégalité,

.

Ce résultat est obtenu dans les différents chapitres de ce livre à l’aide du raisonnement par récurrence transfinie ; mais il est clair, d’après ce qui précède, qu’on le déduira d’un raisonnement par l’absurde toutes les fois qu’on aura prouvé qu’aucun point ne saurait être le dernier pour lequel on a l’inégalité précédente.

Le lecteur pourra rechercher les modifications qu’il faut apporter à notre exposé pour le débarrasser de tout emploi des nombres transfinis et de la récurrence transfinie ; nous allons faire cette transformation de raisonnement seulement pour la première des propositions relatives aux dérivées obtenues à l’aide du procédé des chaînes, la suivante[29] :

Une fonction est déterminée à une constante additive près quand on connaît sa dérivée en tout point. En effet, soit la différence de deux fonctions et ayant la même dérivée finie ; a une dérivée nulle en tout point. Notre procédé des chaînes nous donne

,

quelque petit que soit  ; donc est constante.

Le raisonnement par l’absurde est le suivant : Il existe des points pour lesquels on a l’inégalité précédente, soit le dernier des points pour lequel cette inégalité est vérifiée. Prenons, ce qui est toujours possible, assez petit positif pour que dans on ait

 ;

alors dans tout cet intervalle, on a

ce qui montre qu’il était absurde de supposer que l’inégalité considérée n’avait pas lieu pour .

Cette forme de la démonstration a été donnée par M. Denjoy[30].

L’étude des fonctions possédant une certaine propriété en chacun de leurs points, conduit tout naturellement à utiliser les chaînes d’intervalles[31], donc la récurrence transfinie. Chacun de ces raisonnements pourra être transformé comme il vient d’être dit de façon à n’utiliser que les propriétés du continu.

Il semble beaucoup plus difficile d’éliminer le transfini des autres applications que nous en faisons ici : théorème de Cantor-Bendixson, résultats de M. Baire, théorie de la totalisation. Mais une distinction s’impose. Nous avons décomposé le théorème de Cantor-Bendixson en deux énoncés VI et VII. L’énoncé VI se réfère à la notion des dérivés qui n’a été acquise que par récurrence transfinie, nous ne pouvons donc pas justifier cet énoncé sans l’emploi du transfini ; l’énoncé VII, au contraire, est une propriété des ensembles fermés que l’on peut espérer obtenir sans le transfini.

On peut dire encore que VII est le théorème d’existence de Cantor-Bendixson et que VI fournit un procédé opératoire transfini pour résoudre le problème de Cantor-Bendixson : « étant donné un ensemble fermé , on demande de le décomposer en un ensemble dénombrable et un ensemble parfait  ».

De même, il y a à distinguer, à l’occasion des recherches de M. Baire, entre le théorème de M. Baire : « toute fonction de classe un est ponctuellement discontinue sur tout ensemble parfait et inversement » et le problème de M. Baire : « étant donnée une fonction ponctuellement discontinue sur tout ensemble parfait, trouver une série de fonctions continues dont elle soit la somme ? » Rien n’empêche d’espérer que l’on puisse démontrer le théorème de M. Baire sans l’emploi du transfini, mais le procédé opératoire, donné par M. Baire pour résoudre le problème de M. Baire, est transfini ; il ne saurait être justifié sans le transfini.

Dans les recherches de M. Denjoy, les énoncés se réfèrent à l’opération de totalisation dont la définition même est transfinie ; on ne peut espérer s’y passer du transfini.

Mais rien n’empêche d’espérer qu’on arrivera à remplacer le procédé opératoire de Cantor-Bendixson (énoncé VI), le procédé opératoire de M. Baire, la totalisation de M. Denjoy par des procédés non transfinis et permettant cependant de résoudre les problèmes de Cantor-Bendixson, le problème de M. Baire, le problème des fonctions primitives.

En fait, on a pu démontrer sans le transfini le théorème de Cantor-Bendixson et le théorème de Baire, et l’on peut résoudre le problème de Cantor-Bendixson sans le transfini. Voyons comment.

Dans les trois ordres de recherches dont il s’agit actuellement, les nombres transfinis sont intervenus pour noter les éléments successifs de suites ; ces éléments sont des ensembles fermés, tous différents, chacun d’eux contenant ceux qui viennent après lui dans la suite. Nous savons (p. 324), qu’une telle suite est finie ou dénombrable. Or, dans les questions étudiées, la suite ne peut s’arrêter que lorsqu’on arrive à un ensemble ne contenant aucun point ou parfait et la démonstration des théorèmes se réduit à prouver que, dans certaines conditions, la suite ne se termine pas par un ensemble parfait. Tout revient donc à caractériser l’ensemble parfait qui pourrait se présenter par une propriété de ses points.

Je ne m’occuperai ici que du théorème de Cantor-Bendixson[32] ; dans ce cas, il saute aux yeux que les points de l’ensemble parfait sont caractérisés par le fait d’être ceux au voisinage desquels il y a une infinité non dénombrable de points de l’ensemble.

Ceci aperçu, appelons point d’accumulation d’un ensemble tout point tel que dans tout intervalle contenant à son intérieur, il y ait une infinité non dénombrable de points de [33].

Le théorème de Bolzano-Weierstrass suggère l’énoncé suivant : tout ensemble , qui est non dénombrable dans , y admet des points d’accumulation. En effet, soit la plus petite valeur de telle qu’il n’y ait qu’une infinité dénombrable au plus de points de dans et qu’il y en ait une infinité non dénombrable dans quel que soit . Un tel point existe bien ; or, dans il y a une infinité non dénombrable de points de  ; donc est un point d’accumulation de .

De cette démonstration il résulte aussi que, dans , il n’y a, au plus, qu’une infinité dénombrable de points de puisqu’il n’y en a qu’une infinité dénombrable au plus dans , quel que soit . Donc ne peut être en . Il y a au moins un point d’accumulation à l’intérieur de .

Un point d’accumulation ne peut, d’après cela, être isolé ; car, si était seul point d’accumulation de dans , il n’y aurait qu’au plus une infinité dénombrable de points de et dans et dans , donc dans  ; et ne serait pas un point d’accumulation. Or l’ensemble des points d’accumulation est évidemment fermé, donc : l’ensemble des points d’accumulation d’un ensemble non dénombrable est parfait.

Appliquons ceci à un ensemble fermé  ; il contient alors son dérivé et a fortiori l’ensemble parfait de ses points d’accumulation. Donc est la somme de et de l’ensemble de ceux de ses points qui sont contenus dans les divers intervalles contigus à . Mais dans chaque il n’y a qu’au plus une infinité dénombrable de points de , les sont en nombre fini ou dénombrable, donc l’ensemble est dénombrable. Le théorème de Cantor-Bendixson est démontré :

.

Si n’avait pas été supposé fermé, on aurait vu de même que l’ensemble des points de qui ne sont pas points d’accumulation de , est dénombrable. Quant aux points de ce sont ceux des points d’accumulation de qui appartiennent à , ils forment un ensemble non seulement partout dense sur l’ensemble des points d’accumulation, mais partout accumulé sur . En entendant par là que, dans tout intervalle contenant des points de à son intérieur, il y a une infinité non dénombrable de points communs à et à  ; sans quoi, en effet, serait dénombrable dans , ce qui est absurde.

La nouvelle méthode prouve donc très simplement le théorème de Cantor-Bendixson et même le généralise ; de plus, elle résout le problème de Cantor-Bendixson si l’on fait la convention que déterminer les points d’accumulation d’un ensemble est l’une des opérations que nous regarderons comme toujours possible effectivement. Et cela parce que nous savons, en fait, l’effectuer souvent.

FIN.
  1. On peut toujours supposer que l’ensemble qui figure dans cet énoncé est fermé ; il suffirait donc d’étudier seulement les ensembles fermés, mais il ne résulterait de cette limitation aucune simplification notable.
  2. Il s’agit de points en ligne droite, donc de nombres ; il n’y aurait que peu de changements s’il s’agissait d’ensembles de points dans un espace à plusieurs dimensions ; d’ailleurs l’emploi des courbes telles que la courbe de Peano permet de se borner à l’étude du cas de la droite.
  3. Nous venons de prouver, en somme, qu’il y a toujours des points communs à la fois à tous les ensembles , , …, lorsque ces ensembles sont fermés et que chacun d’eux contient tous ceux qui le suivent dans la suite , , …. L’ensemble de ces points est évidemment fermé.
  4. Le raisonnement qui nous a servi donne un résultat général qui s’énonce, à l’aide d’une notion définie dans le paragraphe suivant, sous la forme : Un ensemble bien ordonné dénombrable d’ensembles fermés, tels que chacun d’eux contienne tous ceux qui le suivent, étant donné ; il y a des points communs à tous ces ensembles et ces points forment un ensemble fermé.
  5. Nous réserverons le nom de suite simplement infinie pour les suites dont les éléments se notent à l’aide des entiers successifs.
  6. Les nombres transfinis ainsi conçus sont les nombres transfinis ordinaux. Cantor considère aussi des nombres transfinis cardinaux qui lui servent à noter des puissances d’ensembles.
  7. On remarquera que si nous appliquions la définition précédente du type d’ordre aux suites finies, ce serait le nombre 11 qui serait le type d’ordre d’une suite de 10 éléments.
  8. Ses principaux Mémoires à ce sujet se trouvent dans les Math. Ann., Bd 46 et Bd 49. Ces Mémoires ont été traduits par F. Marotte (Sur les fondements de la théorie des ensembles transfinis, Hermann, 1899).
  9. On remarquera que nous nous proposons de construire un ensemble dont le dernier dérivé a un rang donné, et non pas un ensemble pour lequel le premier dérivé n’existant pas à un rang . D’après la proposition III, un tel ensemble ne pourrait exister quand est de seconde espèce.
  10. Nous supposons donc tout entier à distance finie ; cette supposition n’a rien d’essentiel. On traiterait le cas général soit par une transformation telle que soit en décomposant l’ensemble en les ensembles , étant formé de ceux des points de qui sont dans . Pour le cas où n’est pas tout entier à distance finie, il est commode de convenir de dire que le dérivé de contient un point à l’infini.
  11. Nous venons en somme de prouver une propriété générale des suites d’ensembles fermés qui sera énoncée dans le texte dans un moment.
  12. Voir Acta mathematica, t. 2.

    J’ai dit que nous ne nous écarterions pas des idées de Cantor, mais la forme de la démonstration du texte est très différente de celle de Cantor au point de vue suivant. Cantor utilise la conception de l’ensemble total des dérivés différents ou non, que l’on peut attacher à chaque nombre de et il appelle l’ensemble des points communs à tous ces dérivés. Cet ensemble est une sorte de dérivé venant après tous ceux, relatifs aux nombres transfinis de , le symbole est, pour Cantor, le premier nombre transfini de la seconde classe de nombres transfinis ; il vient après tous les éléments de .

    Nous avons évité, au contraire, de raisonner sur l’ensemble conçu comme actuellement formé tout entier ; nous n’avons raisonné que sur le procédé de formation de et sur l’un quelconque des segments de obtenus au cours de l’application de ce procédé. De cette manière, nous n’utilisons à aucun moment un ensemble bien ordonné non dénombrable.

  13. Mon but est ainsi nettement délimité ; je n’aborderai donc pas les questions, plus philosophiques que mathématiques, que pose la conception de la suite des entiers. Cette notion est considérée par moi comme acquise et parfaitement claire.
  14. On se reportera avec intérêt à ce que dit M. Borel d’une conversation qu’il eut avec M. Baire (Leçons sur la théorie des fonctions, 2e édition, p. 178).
  15. La suite que nous avons appelée n’est déterminée que si l’est, quand est de première espèce ; quand est de seconde espèce la définition que nous avons donnée de supposait que les nombres inférieurs à avaient été rangés d’une manière déterminée, en suite simplement infinie.
  16. Pour que soit bien déterminé quand l’est, il faut prendre quelques précautions, d’ailleurs élémentaires, pour tenir compte de ce que les nombres décimaux ont deux développements décimaux.
  17. Dans un Mémoire tout récent, auquel je ne puis que renvoyer le lecteur, M. Hilbert est revenu sur la question (Sur l’infini, Acta mathematica, t. 48).
  18. Ces citations sont faites d’après la traduction de M. Marotte.
  19. Ce qui nous arrive ici se présente toujours quand on éclaircit une notion d’abord obscure. Quand on a su que raisonner sur les nombres imaginaires, c’était raisonner sur des couples de nombres réels, l’emploi des imaginaires était devenu à la fois sans obscurité et sans nécessité. Du moins du point de vue logique ; mais pratiquement, on avait les plus gros avantages à faire usage des imaginaires dont l’emploi était devenu à la fois légitime et avantageux.
  20. Il ne va s’agir que des raisonnements applicables à un nombre transfini quelconque ; des raisonnements relatifs à un nombre transfini particulier pourraient être de nature tout à fait différente de ceux que nous allons étudier :

    Considérons la fonction , dans l’expression de laquelle représente l’une quelconque des fonctions continues constamment croissantes qui varient de à quand varie de à . Raisonner sur l’ensemble des valeurs de au voisinage desquelles est infinie, c’est raisonner sur le nombre  ; mais il est clair qu’on n’utilise pas alors la notion générale d’ensemble bien ordonné.

  21. J’emploie à dessein le mot convaincre pour marquer qu’à mon avis les raisons de se déclarer satisfait par un raisonnement sont de nature psychologique, en mathématique comme ailleurs. La logique nous donne des raisons pour rejeter certains raisonnements, elle ne peut nous faire croire à un raisonnement.
  22. C’est à l’occasion des difficultés que présentent certains raisonnements par l’absurde qu’a été soulevée la question dite du « tiers exclu ». On verra à ce sujet les travaux de M. Brouwer et de M. Weyl. On me permettra peut-être de profiter de cette occasion pour rappeler que, bien avant que la question n’ait pris la forme philosophique actuelle, j’écrivais (Soc. math. de France, 1904) « … je n’attribue pas plus de valeur à la méthode par laquelle on démontre qu’un ensemble non fini contient un ensemble dénombrable. Bien que je doute fort qu’on nomme jamais un ensemble qui ne soit ni fini, ni infini, l’impossibilité d’un tel ensemble ne me paraît pas démontrée. »

    Je voulais dire par là que des définitions ayant été posées pour les deux mots fini et infini il n’était pas certain que non fini veuille dire infini. Cette observation n’est pas sans rapport avec certaines des idées de M. Brouwer ; mon but, en la faisant, était pourtant tout à fait l’opposé du sien. Je ne conteste nullement, pour ma part, la valeur de la logique traditionnelle et du mode de raisonnement par l’absurde ; je rappelle seulement qu’il faut les utiliser correctement.

    La façon méprisante dont M. Brouwer parle de l’École de Paris souligne très heureusement notre désaccord.

  23. La légitimation par l’absurde du procédé par récurrence est bien moins parfaite à cet égard, puisqu’elle exige une infinité actuelle de syllogismes.
  24. Cette infinité est dénombrable ; c’est pour ne pas avoir à considérer une infinité non dénombrable de prémisses que j’ai évité précédemment de parler de la suite non dénombrable des dérivés distincts ou non d’un ensemble donné.
  25. Cette explication a pu être omise dans le corps de l’Ouvrage et ajournée jusqu’ici, c’est dire à quel point les définitions suivantes sont naturelles et en quelque sorte nécessaires.
  26. La présence d’un terme , rétablit l’accord entre la définition des types d’ordre pour fini et transfini. Voir la note 1 de la page 320.
  27. M. Borel suppose l’infinité dénombrable, mais ceci est inutile.
  28. J’ajoute qu’il n’est à certains égards aucune opération que l’on sache toujours effectuer réellement. Calculer la valeur d’une fonction connue, de , par exemple, est une telle opération. Quand nous disons que est donnée si est connue quand est connu, nous ne donnons pas l’explication de ce qu’on doit entendre par une fonction donnée, nous faisons cette convention : quand on a dit que est donnée, on raisonne comme si l’on pouvait calculer pour chaque valeur de .
  29. On se reportera à la page 86 ; à cet endroit les conditions envisagées sont un peu plus générales que celles de l’énoncé du texte, nous nous plaçons ici dans les conditions les plus simples.
  30. (Jour. de Math., 1915, p. 176). M. Denjoy n’obtient d’ailleurs pas cette démonstration, comme nous le faisons ici, en transformant un raisonnement déjà donné dans la première édition de ce livre ; tout au contraire, il oppose sa méthode à celles de cette première édition. Mais il ne fait allusion qu’aux démonstrations utilisant le théorème des accroissements finis ; il lui a évidemment échappé que la méthode des chaînes, puisqu’elle permettait la recherche des fonctions primitives d’une dérivée donnée, fournissait par cela même la preuve que ces fonctions étaient déterminées à une constante additive près, et que j’avais utilisé cette méthode de démonstration à la page 79 de la première édition. Seulement je ne m’y étais pas donné la peine de montrer, comme je l’ai fait dans cette édition nouvelle (page 86), que le procédé des chaînes donnait les énoncés antérieurement acquis ; je m’en étais surtout servi pour avoir de nouveaux énoncés.

    Je profite de cette occasion pour dire que je ne suis pas d’accord avec M. Denjoy et certains autres auteurs qui opposent comme entièrement différents des raisonnements faits sur les dérivées, dont les uns emploient la notion d’intégrale, tandis que les autres ne l’emploient pas mais utilisent le théorème de la moyenne :

    lorsque .

    Tout théorème basé sur l’intégration peut être exposé en ne faisant appel qu’au théorème de la moyenne. D’ailleurs, désirant donner plus d’unité de forme à cet Ouvrage, j’ai voulu, au Chapitre X, déduire de la totalisation certains théorèmes obtenus par M. Denjoy sans utiliser la totalisation, exactement comme j’avais déduit, au Chapitre IX, certains théorèmes de l’intégration ; cela m’a été très facile et je n’ai pas eu à m’écarter notablement des démonstrations mêmes de M. Denjoy, tant il y a peu opposition entre les idées utilisées dans les raisonnements qui font appel à l’intégration et ceux qui ne l’utilisent pas.

    Cela, bien entendu, ne veut pas dire que je méconnais l’intérêt des diverses formes de démonstrations, la grande élégance de certaines d’entre elles, et le progrès qu’il y a à utiliser les procédés les plus simples. C’est au contraire la comparaison de ces formes de démonstrations qui m’a conduit aux réflexions que j’expose dans le texte.

  31. Voir la note 2 de la page 112.
  32. J’ai donné plusieurs démonstrations du théorème de M. Baire sans employer le transfini (Bull. de la Soc. math. de France, 1904. — Note II des Leçons de M. Borel, Sur les fonctions de variable réelle.Journ. de Math., 1905) ; ces démonstrations consistaient surtout, conformément à ce qui est dit dans le texte, en la définition d’un ensemble parfait.

    M. E. Lindelöf (Acta mathematica, t. 29) et moi-même (dans la première édition de ce livre) avons à peu près simultanément montré que le théorème de Cantor-Bendixson pouvait être tiré de la notion de ce que M. Lindelöf appelle un point de condensation. Je crois qu’on dit plus souvent maintenant point d’accumulation, c’est cette dénomination que j’adopte.

    Dans mon exposé, comme j’arrivais simultanément aux théorèmes VI et VII, il apparaissait mal que la démonstration du théorème VII était indépendante des nombres transfinis. J’adopte ici, à peu près, l’exposé de M. Lindelöf préférable au mien à bien des égards ; c’est-à-dire que je ne m’occupe que du théorème VII.

    En donnant ces méthodes, j’avais indiqué l’intérêt que présentent les démonstrations tirées du transfini parce qu’elles fournissent des procédés opératoires réguliers, permettant non seulement de démontrer les théorèmes, mais aussi de résoudre les problèmes (Journ. de Math., 1905, p. 183 ; C. R. Acad. Sc., 1903).

    Les dénominations théorème et problème, qui concrétisent si heureusement les distinctions à faire, sont dues à M. de la Vallée Poussin.

  33. Je me place donc dans le cas des ensembles de points sur une droite comme nous l’avons toujours fait jusqu’ici, mais le raisonnement s’étend à l’espace à dimensions.