CHAPITRE XI.
L’INTÉGRALE DE STIELTJÈS.
En 1894, Stieltjès, à l’occasion de recherches relatives à des développements en fractions continues[1], a défini un nouveau mode d’intégration des fonctions continues. Il importe de bien comprendre l’originalité de la généralisation de Stieltjès et en quoi elle diffère profondément de celles que nous avons examinées jusqu’ici. Au Chapitre I, nous avions rappelé ce qu’on appelle l’intégration dans les cours élémentaires de calcul infinitésimal ; c’est une opération bien déterminée faisant correspondre un nombre à chaque fonction continue
. Aux Chapitres II, III, VI, VII, X nous avons défini cette opération pour des familles de fonctions
de plus en plus larges ; nous avons étendu la notion d’intégration en profondeur dans la mine des fonctions
. Stieltjès, lui, laisse invariable la famille de fonctions
considérées ; mais, pour la même fonction
, il définit autant d’intégrations que l’on veut ; chacune d’elles fait correspondre un nombre à
. Il étend la notion d’intégration en surface dans le champ des opérations fonctionnelles.
Dans ce Chapitre, nous donnerons la définition de l’intégrale de Stieltjès d’une fonction continue
, ce qui est l’analogue du Chapitre I, puis nous devrions, comme aux Chapitres II, III, VI, VII, X, étendre cette notion à des classes de fonctions de plus en plus larges, enfin nous aurions à examiner, comme aux Chapitres IV, V, VIII, IX, des notions et des problèmes liés à la nouvelle intégrale. L’exécution de ce programme supposerait effectuées des recherches qui n’ont même pas encore été abordées ; sur bien des points nous nous contenterons de poser des problèmes.
I. — L’intégration de Stieltjès définie à l’aide de la théorie des fonctions sommables.
Soit
une fonction à variation bornée dans un intervalle
; nous l’appellerons la fonction déterminante de l’intégration qui va être définie.
étant une fonction continue dans
, nous appelons intégrale de Stieltjès de
, prise dans
par rapport à la fonction déterminante
, la limite de la somme
![{\displaystyle \mathrm {S} =\sum _{0}^{n}f(\xi _{i})[\alpha (x_{i+1})-\alpha (x_{i})]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/81821727a06805d829bc747059efc53b08a8ab77)
,
relative à une division de
faite à l’aide de valeurs
se succédant dans l’ordre :
,
,
, …,
, quand on fait croître indéfiniment le nombre
et que l’on choisit les
de façon que le maximum de
tende vers zéro.
désigne une valeur quelconque de
prise dans
.
Pour justifier cette dénomination, il faut, prouver que la limite existe. Considérons une suite de divisions de
, soit
,
, …, obtenues chacune par subdivision des intervalles de la division précédente, et soient
,
, … les valeurs de
fournies par ces divisions et certains choix des
.
Soit
la contribution dans
d’un des intervalles de
. Dans
l’intervalle
se trouve divisé par des points
et fournit une contribution de la forme
![{\displaystyle \textstyle \sum _{1}f(\eta _{j})[\alpha (y_{j+1})-\alpha (y_{j})]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2dde732d0a05f9f08fb48c6437b9229b585f973b)
,
la sommation étant étendue à certaines valeurs de
. Or, avec les mêmes valeurs de
, on a
![{\displaystyle f(\xi _{i})[\alpha (x_{i+1})-\alpha (x_{i})]=\textstyle \sum _{1}f(\xi _{i})[\alpha (y_{j+1})-\alpha (y_{j})]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cfc083d02e54eea6f754767a2cf16c6260b9403f)
.
La différence entre les deux contributions de
est donc
![{\displaystyle {\begin{aligned}\textstyle \sum _{1}[f(\eta _{j})-f(\xi _{i})][\alpha (y_{j+1})-\alpha (y_{j})]&\leqq \omega _{i}\textstyle \sum _{1}|\alpha (y_{j+1})-\alpha (y_{j})|\\&\leqq \omega _{i}\mathrm {V} _{i}{\text{,}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/55213890436af59bb77a98f4a32be29a6912e8d9)
désignant l’oscillation de
dans
et
la variation totale de
dans le même intervalle.
D’où, par addition,

,
étant la variation totale de
dans
et
le maximum de l’oscillation de
dans les intervalles de la division
. Or
tend vers zéro quand
augmente indéfiniment, par hypothèse, donc la suite des
est convergente.
Le cas particulier des suites
,
, …, obtenues par subdivisions successives, ainsi examiné, on passe au cas général par le raisonnement qui nous a tant de fois servi.
L’intégrale que nous venons de considérer est l’intégrale définie, elle se note
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5d0798d05290342da8a0a29f1556586715d3a209)
.
Elle jouit évidemment des propriétés
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=-\int _{b}^{a}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b5aa6aabf727edb2906907a3340e7a5802a4e767)
,
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]+\int _{b}^{c}f(x)\,\mathrm {d} [\alpha (x)]+\int _{c}^{b}f(x)\,\mathrm {d} [\alpha (x)]=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a6448c9913383613ded5cd201af2f7879590cece)
,
![{\displaystyle \int _{a}^{b}[f(x)+g(x)]\,\mathrm {d} [\alpha (x)]=\int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]+\int _{a}^{b}g(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c53c444fb4d98fd9f50f4e3ac7c47f0c3db71c3c)
.
Pour cette intégrale, le théorème de la moyenne s’énonce ainsi : Si l’on a

,
il en résulte
![{\displaystyle \left\vert \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]\right\vert <\mathrm {MV} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/33731c8552b4c3402e14a10c44cf880b31eba3e8)
,
étant la variation totale de
dans
.
Toutes ces propriétés résultent de suite de l’examen des sommes
.
La fonction
![{\displaystyle \mathrm {F} (x)={\text{const.}}+\int _{a}^{x}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5f421169ac72ba02cd9c2a3e61a10265d9149fb2)
est dite la fonction d’une variable intégrale indéfinie, au sens de Stieltjès, de
prise par rapport à
. Cette définition s’applique pour
, nous compléterons tout à l’heure la définition pour
.
L’intégrale indéfinie est une fonction à variation bornée. Représentons par
la variation totale de
de
à
on a ;
![{\displaystyle |\mathrm {F} (l)-\mathrm {F} (m)|=\left\vert \int _{m}^{l}f(x)\,\mathrm {d} [\alpha (x)]\right\vert \leqq \mathrm {M} [\mathrm {V} (l)-\mathrm {V} (m)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/02edb62c0530d9d764b81ee3b49267dc5e6a7a73)
,
désignant la limite supérieure du module de
dans
. Donc si l’on partage
en un nombre fini d’intervalles
on a
![{\displaystyle \textstyle \sum |\mathrm {F} (x_{i+1})-\mathrm {F} (x_{i})|\leqq \mathrm {M} \sum [\mathrm {V} (x_{i+1})-\mathrm {V} (x_{i})]=\mathrm {MV} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/5cbebe665ec87694528e687052be280977445013)
.
Cette inégalité démontre la proposition et donne la limite supérieure
pour la variation totale de l’intégrale indéfinie.
Lorsque la fonction déterminante est continue, l’intégrale indéfinie est continue. En effet, dans ce cas,
tend vers zéro avec la longueur de
; donc il en est de même de
.
D’une façon plus générale, l’intégrale indéfinie est continue en tout point de continuité de
. Mais elle est discontinue en
si
est différent de zéro et si
admet
pour point de discontinuité. En effet,
étant supposé différent de
, soient
et
deux fonctions définies comme il suit :
pour
,

,

;
en
,

,

;
pour 

,

.
et
sont deux fonctions à variations bornées dont la somme est
. L’intégrale indéfinie
, relative à
, est donc la somme de celles relatives à
et
; soient
et
. Or
est continue en
, car
est continue en
et
est évidemment égale à
une constante ,
|
pour ;
|
,
|
pour» ;
|
,
|
pour» .
|
Donc
est discontinue en
, et par suite aussi
, si
est différent de zéro. En même temps, nous avons prouvé que : Si l’on désigne par
et
les sauts de gauche et de droite de
au point
, la fonction des sauts de l’intégrale indéfinie de
, prise par rapport à
, est

,
les sommations étant étendues à toutes les valeurs indiquées par les inégalités, ou, ce qui est équivalent, à toutes celles de ces valeurs qui sont des points de discontinuité de
. Toutefois, c’est par une convention nouvelle, complétant la définition de l’intégrale indéfinie, que nous avons fait figurer le point
dans la première sommation.
Par suite aussi, l’intégrale corrigée de sa fonction des sauts,
, est l’intégrale indéfinie, au sens de Stieltjès, par rapport à la fonction déterminante obtenue en corrigeant
de sa fonction des sauts

.
Les intégrales de Stieltjès relatives à des fonctions déterminantes discontinues, se calculent donc facilement à partir de celles résultant des fonctions déterminantes continues. Celles-ci, dans les cas usuels, se calculent de suite.
Supposons, par exemple,
continue et croissante, au sens strict,
pour
; le changement de variable
transforme
en une fonction
et la définition de
en celle de l’intégrale ordinaire de
. Ainsi
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{\alpha (a)}^{\alpha (b)}g(\alpha )\,\mathrm {d} \alpha }](https://wikimedia.org/api/rest_v1/media/math/render/svg/a2a986ecbda143ee52df0f96942a68220b499bb4)
,
et l’on est ramené à une intégration ordinaire de fonction continue. C’est d’ailleurs la formule précédente qui est l’origine même de la notation de l’intégrale de Stieltjès.
Le cas général où
est continue se ramène à celui-ci.
Soient
et
les deux variations totales positive et négative de
, les deux fonctions

,

sont croissantes au sens strict, et l’on a

.
Si donc on pose

,
on en déduit
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{\alpha _{1}(a)}^{\alpha _{1}(b)}g_{1}(\alpha _{1})\,\mathrm {d} \alpha _{1}-\int _{\alpha _{2}(a)}^{\alpha _{2}(b)}g_{2}(\alpha _{2})\,\mathrm {d} \alpha _{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af1111c41e6268812973edac127d358df3304ac9)
.
Enfin, le cas le plus général se traite de même :
et
étant formées à l’aide des variations totales de
corrigée de sa fonction des sauts, on a, avec les notations précédentes,
![{\displaystyle {\begin{aligned}\int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=&\sum _{a\leqq x_{i}<x}f(x_{i})s_{d}(x_{i})+\sum _{a<x_{i}\leqq x}f(x_{i})s_{g}(x_{i})\\&+\int _{\alpha _{1}(a)}^{\alpha _{1}(b)}g_{1}(\alpha _{1})\,\mathrm {d} \alpha _{1}-\int _{\alpha _{2}(a)}^{\alpha _{2}(b)}g_{2}(\alpha _{2})\,\mathrm {d} \alpha _{2}{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2bd1edb792ca7303e6f02f6be4f7bb5cc80941c7)
Toute intégrale de Stieltjès s’exprime donc à l’aide d’intégrales ordinaires. Avant de tirer des conséquences de ce fait essentiel, donnons d’autres formules équivalentes à la précédente. Celle-ci présente l’avantage de ne faire appel à l’intégration que sous sa forme la plus primitive : intégrale d’une fonction continue dans un intervalle ; par contre elle exige deux intégrales, l’emploi des séries et des changements de variables.
Supposons que
soit continue, croissante au sens strict, et à dérivée continue ; alors aucun changement de variable n’est nécessaire car on a
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{\alpha (a)}^{\alpha (b)}g(\alpha )\,\mathrm {d} \alpha =\int _{a}^{b}f(x)\alpha '(x)\,\mathrm {d} x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0eb4e313dae60cc67c97c576cfb6a2f821729a98)
,
en revenant de la variable
à la variable
par la formule classique du changement de variable[2]. En somme, nous traitons ici l’intégrale de Stieltjès en remarquant qu’elle se réduit à l’intégrale curviligne
, attachée à la courbe
.
La formule précédente s’étend au cas où
est seulement supposée absolument continue ; désignons alors par
la fonction, déterminée seulement aux points d’un ensemble de mesure nulle près, dont
est l’intégrale indéfinie ; fonction qu’on pourrait appeler la presque dérivée de
. On a
![{\displaystyle \mathrm {S} =\sum f(\xi _{i})\left[\alpha (x_{i+1})-\alpha (x_{i})\right]=\sum f(\xi _{i})\int _{x_{i}}^{x_{i+1}}{'\!\alpha (x)}\,\mathrm {d} x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6e068a61b7dbc3af08c06dead0afb364548a2531)
.
Donc
![{\displaystyle \mathrm {S} -\int _{a}^{b}f(x).{'\!\alpha (x)}\,\mathrm {d} x=\sum \int _{x_{i}}^{x_{i+1}}\left[f(\xi _{i})-f(x)\right].{'\!\alpha (x)}\,\mathrm {d} x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bbb5b5fc7501834cbac33311e6628b91b498b724)
.
Il en résulte,
désignant le maximum de l’oscillation de
dans les intervalles
et
représentant toujours la variation totale de
dans
,

.
D’où, par passage à la limite,
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} \left[\alpha (x)\right]=\int _{a}^{b}f(x).{'\!\alpha (x)}\,\mathrm {d} x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/456b8250b511cca2faa08f4f1c4005e790296c79)
.
Lorsque la fonction à variation bornée
est simplement supposée continue, un changement de variable suffit pour nous ramener au cas précédent ; il est clair en effet que si l’on a un changement de variable
uniforme dans les deux sens faisant correspondre
à
, on a toujours
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} \left[\alpha (x)\right]=\int _{t_{1}}^{t_{2}}f[x(t)]\,\mathrm {d} \!\left\{\alpha \!\left[x(t)\right]\right\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f2457b2dae2a6d65041d8b7b6d19cb752d210082)
.
Il suffit de choisir
de manière que
soit absolument continue en
pour pouvoir appliquer la formule précédente. Cette variable
pourrait être la longueur de la courbe
, depuis
jusqu’à
; il est plus simple ici de prendre[3]

,
étant, comme précédemment, la variation totale de
de
à
. Alors on a, en posant
,
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{a}^{b+\mathrm {V} }f[x(t)].{'\!\mathrm {A} (t)}\,\mathrm {d} t}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6296a77cadd040926dc6686fd00f86c456c649f0)
.
Si
était continue et variable dans tout intervalle on pourrait poser
et l’on aurait
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{0}^{\mathrm {V} }f[x(v)].{'\!\alpha [x(v)]}\,\mathrm {d} v}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77eca8e2ead71af390e0c491b1ab4a186b1990ea)
.
Nous allons étendre cette formule à tous les cas : posons pour cela les définitions suivantes :
désignant la variation totale, de
à
, de la fonction déterminante
, à toute valeur
comprise entre 0 et
, il correspond :
a. Soit une ou plusieurs valeurs de
telles que l’on ait
, nous choisissons alors l’une de ces valeurs
et nous posons

,
![{\displaystyle \mathrm {A} (v_{0})=\alpha [x(v_{0})]=\alpha (x_{0})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/542d7627e4c656c44b7634f26c52e461ddb80d14)
,
b. Soit une valeur
, telle que l’on ait
ou

;
nous posons alors
et, dans le premier cas
![{\displaystyle \mathrm {A} (v_{0})=\alpha (x_{0}-0)+{\frac {\alpha (x_{0})-\alpha (x_{0}-0)}{\mathrm {V} (x_{0})-\mathrm {V} (x_{0}-0)}}\left[v_{0}-\mathrm {V} (x_{0}-0)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59b9ddd58ddd6fff80ee3be9408efdcb7cc8d736)
,
dans le second
![{\displaystyle \mathrm {A} (v_{0})=\alpha (x_{0})+{\frac {\alpha (x_{0}+0)-\alpha (x_{0})}{\mathrm {V} (x_{0}+0)-\mathrm {V} (x_{0})}}\left[v_{0}-\mathrm {V} (x_{0})\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/24a1b7049d3bc2b85131076933834f0f687e6ee6)
,
Avec ces conventions, on a
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{0}^{\mathrm {V} }f[x(v)].{'\!\mathrm {A} (v)}\,\mathrm {d} v}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13641f07aa109ab4b5946bf55f7984df5fc841bd)
.
Pour justifier cet énoncé, partageons
en intervalles partiels
dans chacun desquels l’oscillation de
est inférieure à
. Dans chaque intervalle
choisissons arbitrairement une valeur
et posons
![{\displaystyle {\Delta _{i}=\left[\mathrm {V} (l_{i}),\mathrm {V} (m_{i})\right]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/de3a40650659e1584974a40e433a7d036dffdb3b)
,
![{\displaystyle {\Delta _{i}\mathrm {V} =\mathrm {V} (m_{i})-\mathrm {V} (l_{i})]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/23bb2c52db297ded1e5ea316c1f694e10079f39b)
.
Alors on a
![{\displaystyle {\begin{aligned}&\quad \left\vert \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]-\sum _{i}{\big [}f(\xi _{i})\{\alpha (m_{i})-\alpha (l_{i})\}{\big ]}\right\vert \\&\qquad =\left\vert \sum _{i}\int _{\delta _{i}}\left[f(x)-f(\xi _{i})\right]\,\mathrm {d} [\alpha (x)]\right\vert \\&\qquad \leqq \sum _{i}\left[\varepsilon \int _{\delta _{i}}\mathrm {dV} (x)\right]=\varepsilon \sum _{i}\Delta _{i}\mathrm {V} =\varepsilon \mathrm {V} {\text{ ;}}\\&\left\vert \int _{0}^{\mathrm {V} }f[x(v)].{'\!\mathrm {A} (v)}\,\mathrm {d} v-\sum _{i}{\big [}f(\xi _{i})\{\alpha (m_{i})-\alpha (l_{i})\}{\big ]}\right\vert \\&\qquad =\left\vert \sum _{i}\int _{\Delta _{i}}{\big \{}f[x(v)]-f(\xi _{i}){\big \}}.{'\!\mathrm {A} (v)}\,\mathrm {d} v\right\vert \\&\qquad \leqq \sum _{i}\left[\varepsilon \int _{\Delta _{i}}\left\vert {'\!\mathrm {A} (v)}\right\vert \,\mathrm {d} v\right]=\varepsilon \sum _{i}\Delta _{i}\mathrm {V} =\varepsilon \mathrm {V} {\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9d0f242a325e606a633221858f03be8d869d6292)
Le théorème résulte de suite du rapprochement de ces deux inégalités.
La fonction
a, dans
, une variation totale égale à
;
a donc presque partout une dérivée égale à ±1 et par suite on peut supposer
partout égale à ±1. Cela rend la formule précédente particulièrement simple ; mais, pour ce qui suit, les formules plus compliquées obtenues auparavant conviendraient aussi fort bien ; c’est surtout pour fixer les idées que nous partirons d’une formule bien déterminée de réduction des intégrales de Stieltjès aux intégrales ordinaires ; nous utiliserons la dernière formule établie. Elle exige que soit connue la théorie des fonctions sommables ; mais, dès que cette théorie est connue, le second membre de notre formule a un sens pour des cas beaucoup plus étendus que celui examiné jusqu’ici, où
était continue. Et par suite nous pouvons prendre la formule
![{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} [\alpha (x)]=\int _{0}^{\mathrm {V} }f[x(v)].{'\!\mathrm {A} (v)}\,\mathrm {d} v}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13641f07aa109ab4b5946bf55f7984df5fc841bd)
comme définition même de l’intégrale de Stieltjès de
.
Cette définition s’appliquera, en n’utilisant pour le moment que l’intégration des fonctions sommables, toutes les fois que
sera sommable, donc pour toutes les fonctions
qui sont sommables, puisque
, c’est-à-dire pour toutes les fonctions
qui sont sommables quand on prend pour variable la variation totale
de
entre
à
, et en particulier pour toutes les fonctions bornées qui sont mesurables par rapport à
.
Or, parmi les fonctions
qui sont mesurables par rapport à
, il faut citer toutes les fonctions
qui sont mesurables B par rapport à
. En effet, la formule
fait correspondre à tout intervalle en
un intervalle en
ou un point, à une somme d’ensembles en
, une somme d’ensembles en
, à une différence d’ensembles en
une différence d’ensembles en
plus parfois certaines des valeurs de
correspondant aux intervalles de constance de
; et comme ces valeurs sont en nombre fini ou dénombrables, à tout ensemble mesurable B en
correspond un ensemble mesurable B en
. Si donc
est mesurable B en
, c’est-à-dire si l’ensemble
est mesurable B, l’ensemble
l’est aussi et
est mesurable B en
.
Donc la définition précédente s’applique à une classe de fonctions
, variable avec la fonction déterminante
, mais qui contient toujours la famille des fonctions
bornées et mesurables B.
L’inconvénient de la méthode si rapide qui nous a donné ce résultat c’est qu’elle ne met nullement en évidence l’intérêt que peut présenter l’extension de la notion d’intégrale de Stieltjès. Un théorème de M. Frédéric Riesz mettra cet intérêt en évidence[4].
II. — Les fonctionnelles linéaires.
Nul, depuis Stieltjès, ne s’était occupé de l’intégration d’une fonction par rapport à une fonction quand, en 1909, M. F. Riesz nous révéla que pourtant cette notion avait été l’objet d’assez nombreuses recherches mais sous un autre nom, sous le nom d’opération fonctionnelle linéaire.
Une opération fonctionnelle linéaire est celle qui associe à chaque fonction
, appartenant à une certaine classe de fonctions, un nombre
tel que l’on ait :
1o
|
;
|
|
2o
|
,
|
|
étant un nombre fixe.
La fonctionnelle[5]
fournie par l’opération linéaire est dite elle-même linéaire.
Ce sont surtout des questions de physique mathématique qui ont conduit à la notion de fonctionnelle linéaire ; la classe de fonctions qui se présentait alors, variable avec les questions, contenait toujours les fonctions continues mais aussi souvent divers types de fonctions discontinues. De sorte que le problème de l’extension du champ d’application des opérations fonctionnelles linéaires était virtuellement posé. Or cette extension sera acquise grâce à la généralisation précédente de la notion d’intégrale de Stieltjès et au théorème de M. Riesz.
Parmi les fonctionnelles linéaires définies dans le champ des fonctions continues se trouvent celles de la forme

;
aussi s’est-on adressé à des expressions de cette forme quand on a
essayé de construire la fonctionnelle linéaire la plus générale ; M. Hadamard et M. Fréchet avaient obtenu dans cette direction des résultats fort intéressants ; mais il était réservé à M. Riesz de résoudre complètement la question en montrant que toute fonctionnelle linéaire définie pour toutes les fonctions continues dans
est de la forme
;
étant une fonction à variation bornée qui caractérise la fonctionnelle[6].
Soit
une fonctionnelle linéaire définie dans le champ
des fonctions continues de
à
[7]. L’égalité

a donc lieu dans
; il existe deux cas importants où l’on peut même supposer les fonctions
en nombre infini. C’est d’une part, le cas où la série des
converge uniformément, d’autre part le cas où tous les
, à partir d’une certaine valeur de
, sont de même signe.
Supposons, en effet, que la série des
converge uniformément ; si
est sa limite et
la somme de ses
premiers termes, on a, pour
suffisamment grand
, d’où

.
Le premier cas est ainsi examiné ; or le second se ramène au premier, car si les
sont toutes positives ou nulles et si la somme
de la série des appartient au champ
, l’ensemble
des points où l’on a
est un ensemble fermé lorsqu’il existe, et comme
contient
, et qu’il n’y a pas de point commun à tous les
, l’ensemble
n’existe plus dès que
est assez grand. Donc la série des
converge uniformément.
Examinons maintenant le cas où l’on sait seulement que les
sont positifs ou nuls, et que la série des
converge vers une fonction bornée
[8]. Alors on a, en remarquant que
et
sont égaux et de signes contraires, et en posant
et du signe de
,
![{\displaystyle {\begin{aligned}\sum _{1}^{p}\left|\mathrm {A} (f_{i})\right|&=\sum _{1}^{p}\theta _{i}\mathrm {A} (f_{i})=\mathrm {A} \!\left[\sum _{1}^{p}\theta _{i}f_{i}\right]\\&\leqq \mathrm {M} \times \operatorname {max.\,de\,} {\left\vert \sum _{1}^{p}\theta _{i}f_{i}\right\vert }\\&\leqq \mathrm {M} \times \operatorname {max.\,de\,} {\sum _{1}^{p}f_{i}}\leqq \mathrm {M} \times \operatorname {max.\,de\,} {f}{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6497e7a296f024bf7f65606f64299c6498276c84)
Ainsi, lorsqu’une suite non décroissante ou non croissante de fonctions
de
tend vers une limite bornée, la suite
converge.
Une autre propriété nous sera utile : si
est une fonction de
et si
est une constante, on a

.
Cette propriété est évidente pour
entier ou inverse d’un entier ; on arrive ensuite à
commensurable, puis enfin on atteint
quelconque par un passage à la limite uniforme.
Ceci posé, posons
et, pour
, prenons
égale à la limite des
pour la suite décroissante des fonctions continues
égales à 1 de
à
, égales à 0 de
à
, linéaire de
à
.
Une fonction continue quelconque dans
peut être approchée autant que l’on veut à l’aide d’une combinaison linéaire de fonction
. Formons, en effet, la fonction
![{\displaystyle {\begin{aligned}g_{n}(x)=f&(\xi _{p})f_{n,x_{p}}(x)+\left[f(\xi _{p-1})-f(\xi _{p})\right]f_{n,x_{p-1}}(x)\\&+\left[f(\xi _{p-2})-f(\xi _{p-1})\right]f_{n,x_{p-2}}(x)\\&+\ldots +[f(\xi _{1})-f(\xi _{2})]f_{n,x_{1}}(x){\text{,}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a5d1fc9f43b51852186e58b53ff5af6ddb413b85)
pour

;
elle est, dans chaque
, comprise entre
et
lorsque
est inférieur à la plus petite différence
.
Si donc on a choisi les
de manière que l’oscillation de
soit, dans chaque
, inférieure à
, la différence
est inférieure à
dès que
est assez grand. Et alors la différence
sera inférieure à
.
Or nous connaissons la limite
de
pour
très grand ; elle s’écrit
![{\displaystyle {\begin{aligned}\mathrm {S} =f&(\xi _{p})\alpha (x_{p})+\left[f(\xi _{p-1})-f(\xi _{p})\right]\alpha (x_{p-1})\\&+\ldots +\left[f(\xi _{1})-f(\xi _{2})\right]\alpha (x_{1})\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/afcf5f3d39e8baadd6579a6461cef43334b9ee4b)
ou encore
![{\displaystyle {\begin{alignedat}{2}\mathrm {S} &{}={}&&f(\xi _{1})\left[\alpha (x_{1})-\alpha (x_{0})\right]\\&&{}+{}&f(\xi _{2})\left[\alpha (x_{2})-\alpha (x_{1})\right]+\ldots +f(\xi _{p})\left[\alpha (x_{p})-\alpha (x_{p-1})\right]{\text{.}}\end{alignedat}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/addb10b8fd254d7fb821ad614367bd2a602ffa4d)
Et par suite
est la limite de la somme précédente, c’est-à-dire que
est l’intégrale de Stieltjès de
, prise par rapport à
. Le théorème de M. Riesz sera démontré, dès que l’on aura vérifié que
est à variation bornée.
Or ceci est évident ; si
n’était pas à variation bornée, elle aurait une variation positive égale à
, on pourrait donc trouver des intervalles
,
, …, extérieurs les uns aux autres et en nombre fini tels que
surpasse
;
étant toujours le nombre qui figure dans la seconde propriété des fonctionnelles linéaires. Dès lors, pour les fonctions continues
, égales à 1 dans les
, nulles dans les intervalles
et linéaires dans les intervalles
,
, fonctions qui tendent en décroissant vers la fonction
égale à 1 dans les
et à 0 à l’extérieur, les nombres
tendraient vers
![{\displaystyle \textstyle \sum [\alpha (b_{i})-\alpha (a_{i})]>2\mathrm {M} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/dce422930d0d705002bf52f9611c686c16ba13ba)
;
ce qui est impossible, puisque
ne peut surpasser
.
Ce théorème de M. Riesz attache à chaque fonctionnelle linéaire, définie pour les fonctions
continues dans un intervalle
, une fonction déterminante
et ce que nous avons vu, relativement à l’extension des intégrales de Stieltjès, montre qu’une telle fonctionnelle peut être prolongée au champ de toutes les fonctions qui, par le passage de la variable
à la variation totale
de
dans
, se transforment en fonctions sommables de
. Cette famille est variable avec
mais il importe de noter qu’elle contient toujours toutes les fonctions mesurables B et bornées.
Quand on emploie des fonctionnelles linéaires de fonctions continues
, l’une des propriétés les plus utiles est celle-ci : la somme
de deux fonctionnelles linéaires
et
est elle-même une fonctionnelle linéaire.
Quand on veut étendre le champ des fonctions
et cependant conserver l’avantage de cette propriété, c’est donc à un champ fonctionnel indépendant de la fonction déterminante
qu’il faut s’arrêter ; aussi est-il très intéressant de savoir que toutes les fonctionnelles linéaires définies dans le champ des fonctions continues peuvent être étendues au champ des fonctions mesurables B et bornées.
Il est clair que la fonctionnelle étendue au champ des fonctions mesurables B et bornées, telle que nous l’avons obtenue, y possède la propriété suivante :
3o Si des fonctions
tendent en croissant vers une limite
, on a
![{\displaystyle \mathrm {A} [f(x)]=\lim _{i\to \infty }{\mathrm {A} [f_{i}(x)]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e92b3c2ad88c046a4cdb76fc50e49ffc836c130c)
.
Nous allons vérifier que les propriétés 1o, 2o, et 3o suffisent à caractériser l’extension que nous avons faite au champ des fonctions mesurables B et bornées d’une fonctionnelle linéaire donnée, définie pour les fonctions continues.
Voyons, en effet, comment à partir des propriétés 1o, 2o et 3o nous pourrions prolonger à un champ plus vaste une fonctionnelle linéaire
donnée dans le champ des fonctions continues.
Nous avons vu que, pour
croissant indéfiniment les fonctions
tendent en décroissant vers la fonction
égale à 1 pour
et à 0 pour
; donc, d’après 1o et 3o,
s’en déduit.
Posons, pour
,

.
De 1o se déduit la valeur
.
La suite des fonctions
tend en décroissant, quand
augmente indéfiniment, vers une limite
; donc la valeur de
est déterminée par 1o et 3o.
Nous avons ainsi déterminé la valeur de
pour certaines fonctions
nulles en dehors d’un ensemble
, égales à 1 sur
; nous venons d’arriver aux fonctions
pour lesquelles l’ensemble
est un intervalle fermé. Or, à partir de tels intervalles on construit tout ensemble mesurable B par la répétition de deux opérations : additions d’ensembles sans points communs, soustraction d’un ensemble d’un autre qui le contient ; à la première de ces opérations

les conditions 1o et 3o font correspondre l’égalité
![{\displaystyle \mathrm {A} [f_{\mathrm {E} }]=\mathrm {A} [f_{\mathrm {E} _{1}}]+\mathrm {A} [f_{\mathrm {E} _{2}}]+\mathrm {A} [f_{\mathrm {E} _{3}}]+\ldots }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4133756c7368f03f50152db9e448dc94fce8c7e5)
,
à la deuxième

,
la condition 1o fait correspondre
![{\displaystyle \mathrm {A} [f_{\mathrm {E} }]=\mathrm {A} [f_{\mathrm {E} _{1}}]-\mathrm {A} [f_{\mathrm {E} _{2}}]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/909888204197ea210d356036331f3c2bb5095ddc)
,
donc
est définie pour chaque fonction
relative à un ensemble
mesurable B.
Si maintenant
est une fonction mesurable B bornée quelconque, elle ne diffère que de
au plus de la fonction
![{\displaystyle f^{\varepsilon }(x)={\textstyle \sum }i\varepsilon f_{\mathrm {E} [i\varepsilon \leqq f(x)<(i+1)\varepsilon ]}(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e3c0a54b8bf364e143328f5242f8cd3fee24b768)
;
donc la suite des fonctions
tend uniformément vers
quand
tend vers zéro et l’on déduit de 1o et de 2o, comme nous l’avons fait précédemment, que les nombres
convergent vers une limite, que nous devons prendre pour valeur de
.
Ainsi le prolongement à tout le champ des fonctions mesurables B et bornées, s’il est possible, est unique ; or nous avons vu qu’il était possible[9].
L’extension à ce large champ fonctionnel[10] est donc bien caractérisé par les conditions 1o, 2o et 3o.
Nous allons, grâce à la notion d’intégrale de Stieltjès, obtenir une autre extension. À toute intégration définie nous avons attaché une intégration indéfinie fournissant une fonction de points, une fonction d’intervalles, une fonction d’ensemble mesurable ; de sorte que la notion d’intégrale de Stieltjès conduit à une intégrale indéfinie de Stieltjès fonction de point, à une intégrale indéfinie de Stieltjès fonction d’intervalle, à une intégrale indéfinie de Stieltjès fonction d’ensemble. Cette dernière nous permet, d’associer à la fonction
et à un ensemble
un nombre déterminé
![{\displaystyle \int _{\mathrm {E} _{v}}f[x(v)].{'\!\mathrm {A} (v)}\,\mathrm {d} v=\int _{\mathrm {E} _{x}}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/88d237ca0d9b42fa1d2bea57d4cabb971451b5bb)
.
étant l’ensemble des valeurs de
pour lesquelles
appartient à
. Voici donc définie l’intégrale de Stieltjès de
prise par rapport à
, et étendue à l’ensemble
.
Cette intégrale est définie pour les ensembles
pour lesquels
est mesurable ; cette famille d’ensembles contient tous les ensembles
mesurables B.
L’intégrale est définie pour toute fonction ayant une valeur déterminée aux points de
et égale sur
à une fonction
pour laquelle
est sommable dans
. Donc en particulier cette définition s’applique à toute fonction
bornée et mesurable B sur un ensemble
mesurable B.
Or
est évidemment une fonctionnelle linéaire dans le champ des fonctions
données sur
; donc, quand une fonctionnelle linéaire
est définie pour les fonctions continues dans un intervalle
, on en déduit une famille de fonctionnelles linéaires
, attachées chacune à un ensemble
mesurable B situé dans
et définies pour les fonctions mesurables B bornées sur
, par les conditions
1o
|
;
|
|
2o
|
,
|
|
étant un nombre fixe, inconnu, indépendant de
et de
;
3o Si
tend en croissant vers
sur
, on a
![{\displaystyle \mathrm {A} _{\mathrm {E} }[f(x)]=\lim _{i\to \infty }{\mathrm {A} _{\mathrm {E} }[f_{i}(x)]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f9dd0f1d86054ab0aa6d206ff11036959ef5d83e)
;
4o Si
est égale à
sur
et nulle ailleurs, on a
![{\displaystyle \mathrm {A} _{\mathrm {E} }[f(x)]=\mathrm {A} _{\mathrm {I} }[g(x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d97e0d96d5d8faf0ae7855eff5ab28f26d282391)
.
On peut être surpris de ce résultat car
étant donnée, la fonction déterminante
n’est pas unique. Il est bien clair, en effet, que si l’on modifie
en un seul point
intérieur à
cela ne modifie par
pour les fonctions
continues dans
, car on a
![{\displaystyle {\begin{aligned}\mathrm {A} _{\mathrm {I} }[f(x)]&=\int _{a\leqq x<x_{0}}f(x)\,\mathrm {d} [\alpha (x)]\\&\qquad +f(x_{0})\left[\alpha (x_{0}+0)-\alpha (x_{0}-0)\right]\\&\qquad +\int _{x_{0}<x\leqq b}f(x)\,\mathrm {d} \left[\alpha (x)\right]{\text{ ;}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3475006ce5d6483826bb187488b89bddb74d539b)
et pourtant cela modifie en général
![{\displaystyle {\begin{aligned}\int _{a\leqq x\leqq x_{0}}f(x)\,\mathrm {d} [\alpha (x)]&=\int _{a\leqq x<x_{0}}f(x)\,\mathrm {d} [\alpha (x)]\\&\qquad +f(x_{0})[\alpha (x_{0})-\alpha (x_{0}-0)]{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/98b1956f379a77e12324e75de71bf6e6dddf1c5c)
Le paradoxe vient uniquement de ce que l’on n’a, pour
, l’égalité
![{\displaystyle \mathrm {A} _{a\leqq x\leqq x_{0}}\left[f(x)\right]=\int _{a\leqq x\leqq x_{0}}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/83add1c40683177210503513838be00d4fc6aa79)
,
qu’avec les fonctions
qui sont continues à droite en
. Tel était le cas pour la fonction
qui a été construite au cours de la démonstration du théorème de M. Riesz, on le vérifiera facilement ; mais avec cette fonction on n’a pas
![{\displaystyle \mathrm {A} _{x_{0}\leqq x\leqq b}\left[f(x)\right]=\int _{x_{0}\leqq x\leqq b}f(x)\,\mathrm {d} [\alpha (x)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9357ec41e5b5abebb52bf0efd98310e751fd09b2)
,
quand
est un point de discontinuité de
.
La difficulté que l’on rencontre ici est la même que celle qui s’est présentée précédemment (p. 153). Pour chaque fonction
,
est une fonction d’ensemble complètement additive ; si donc on veut avoir
![{\displaystyle \mathrm {A} _{x_{1}<x\leqq x_{2}}=\int _{x_{1}}^{x_{2}}f(x)\,\mathrm {d} [\alpha (x)]={\mathcal {F}}(x_{2})-{\mathcal {F}}(x_{1})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e66f61cf1f0c717e2dbd5c848e7bdb1c5455c182)
,
en appelant
l’intégrale indéfinie
, il faut que
puisse être fonction génératrice d’une fonction additive d’ensemble et par suite soit, comme nous l’avons vu à l’endroit indiqué, une fonction continue à droite. Or le saut de droite de
est, en
, égal à
, donc
doit être continue à droite.
Pour tourner la difficulté qui se présente ainsi, lorsque l’on veut étendre aux ensembles mesurables une fonctionnelle connue dans un intervalle grâce à une fonction
déterminée et non continue à droite, on peut décomposer
en sa fonction des sauts et sa partie continue

;
donne alors naissance à une fonctionnelle de la forme
![{\displaystyle \textstyle \sum f(x_{0})[\alpha (x_{0}+0)-\alpha (x_{0}-0)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3923e712320272ce81e161b23ff74b556605be53)
,
dont la définition s’applique de suite aux fonctions
discontinues tout aussi bien qu’aux fonctions continues. Quant à l’extension de la fonctionnelle correspondant à
, elle ne soulève plus aucune difficulté[11].
III. — Définition directe de l’intégrale de Stieltjès.
Cette étude des fonctionnelles linéaires fait mieux comprendre la signification des conditions 1I, 2I, …, 6I du problème d’intégration (page 105). Comparons ces conditions aux conditions 1F, 2F, 3F, 4F posées pour les fonctionnelles linéaires (page 269). 3I est identique à 1F ; 6I remplacera 3F ; 2I remplace 4F ; quant à 2F elle se trouve être une conséquence de 4I et 5I. Les conditions 1I, 4I, 5I ne servent qu’à caractériser la fonctionnelle
relative aux fonctions continues dont il faut faire le prolongement. En somme, l’intégrale d’une fonction continue
étant connue dans tout intervalle où la fonction est donnée, nous aurions pu, au Chapitre VII, nous borner à poser les conditions 1F, 2F, 3F et en déduire le prolongement de l’intégrale en raisonnant comme il y a un instant. Seulement, tandis que pour le prolongement de la fonctionnelle linéaire générale nous avons pu nous borner à prouver que le prolongement était unique, parce que le cas de l’intégrale avait été précédemment examiné, il faudrait maintenant vérifier directement que le prolongement est possible. C’est ce que nous allons faire en nous plaçant dans le cas de l’intégrale de Stieltjès la plus générale ; nous obtiendrons ainsi une définition directe de cette intégrale, d’où celle de l’intégrale ordinaire se déduira en faisant
.
Mais, avant de rechercher une forme nouvelle de la définition de l’intégrale de Stieltjès, il convient de voir dans quel cas on peut employer sans modification la définition primitivement posée pour les fonctions continues.
Soit
une fonction bornée dans
et
une fonction à variation bornée, nous formons, comme il a été dit, la somme
![{\displaystyle \mathrm {S} =\sum _{0}^{n}f(\xi _{i})\left[\alpha (x_{i+1})-\alpha (x_{i})\right]=\sum _{0}^{n}f(\xi _{i})\,\delta _{i}\alpha }](https://wikimedia.org/api/rest_v1/media/math/render/svg/b57c8074f40f57695d54e56acd419255595d3d9e)
.
Si, dans
,
varie entre
et
, nous désignerons par
et
deux nombres définis par les conventions
,
|
,
|
si ,
|
,
|
,
|
si ,
|
et
seront les bornes supérieure et inférieure de
prises par rapport à
. L’oscillation de
, toujours dans l’intervalle considéré, sera

.
Ceci posé, si l’on fait varier les
sans faire varier les
,
varie entre
et

;
nous allons montrer que ces sommes, pour une suite de divisions
,
, … en intervalles dont la longueur maximum tend vers zéro, tendent vers des limites déterminées
![{\displaystyle {\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[\alpha (x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0189bd29584c9dff36e0fea9ea6ea71535189f4c)
,
![{\displaystyle {\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[\alpha (x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/07e44465a45d39ac85b74fb4aa38bc86eec58fba)
,
— que nous appellerons les intégrales de Stieltjès-Darboux de
, par excès et par défaut, — pourvu que tout point de discontinuité de
soit point de la division
, à partir d’une certaine valeur de
.
Si
,
,
sont les trois variations totales de
,

,

,
on a
![{\displaystyle {\begin{aligned}\sum _{0}^{n}l_{i}\,\delta _{i}p-\sum _{0}^{n}\mathrm {L} _{i}\,\delta _{i}n\leqq \mathrm {S} &=\sum _{0}^{n}f(\xi _{i})\,\delta _{i}[p-n]\\&\leqq \sum _{0}^{n}\mathrm {L} _{i}\,\delta _{i}p-\sum _{0}^{n}l_{i}\,\delta _{i}n{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3877fc8c04958e5f12967e23b3f49414ea04580a)
Or, pour les fonctions croissantes
et
, l’étude des sommes telles que
est facile. Soit
,
, … une seconde suite de divisions assujettie aux mêmes conditions que la suite des
; soient
et
les nombres
fournis par
et
; nous voulons comparer la suite des
et celle des
.
Si
est pris assez grand,
étant fixe, dans chaque intervalle fourni par
se trouve au plus un des points de
si bien que si
est l’un des intervalles fourni par
,
sera dans un intervalle
de
et
dans
;
. Si
(ou
) est point de discontinuité de
, pour
assez grand
et
seront confondus avec
(ou
et
avec
) ; de sorte que nous ne supposerons
(ou
) différent de zéro que si
(ou
) est point de continuité de
. Alors, remplaçons la contribution de
dans
par
; comme
diffère de la borne supérieure de
dans
d’aussi peu que l’on veut quand
est pris suffisamment grand, — à cause de la petitesse de
et de la continuité de
au point
, — on modifiera ainsi
d’aussi peu que l’on voudra. Faisons cela pour chaque point de division de
, nous aurons un nombre
différent de
de moins de
. Si, entre
et
les points de
sont
,
, … nous pouvons dire que la contribution de
dans
est de la forme
![{\displaystyle {\begin{aligned}{\left[p(s)-p(x)\right]}f(x)&+\mathrm {L^{1}} \left[p(z_{1})-p(s)\right]\\&+\mathrm {L^{2}} \left[p(z_{2})-p(z_{1})\right]+\ldots +\left[p(y)-p(t)\right]f(y){\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d54215ee85d0c04f4534bc6372fb702d109f98d)
Or
,
,
, …,
sont au plus égaux à la borne supérieure
de
dans
; la somme précédente est donc au plus égale à
![{\displaystyle \mathrm {L} \,\left[p(y)-p(x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/22efcf72a1490ae0496343fba6e1ef077c52003c)
.
c’est-à-dire à la contribution de
dans
. Donc on a

.
et par suite

,
dès que
est assez grand. Il en résulte que les
et les
convergent vers une même limite.
Nous venons en somme de démontrer le théorème pour une fonction monotone et l’existence des limites
![{\displaystyle {\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c18e0c2b168e4c9cbd76032958874900515a86f9)
,
![{\displaystyle {\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/94e33d0a0659e988b005b5c05bd8b6014e042556)
,
![{\displaystyle {\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e74a8522879803e1504ac7276ce209ce8269dc8)
,
![{\displaystyle {\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/486d3ec5de6b11df04992a95ffc503f49a90ca68)
,
est prouvée.
En désignant par
l’une quelconque des limites du nombre
, nous pouvons donc écrire :
![{\displaystyle {\begin{aligned}&{\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]-{\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]\\\leqq \lim {\mathrm {S} }\leqq &{\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]-{\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]{\text{ ;}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/14f403b65b6a0efd8ca05f05f50ccc9bc10eaead)
ou

.
La différence entre les membres extrêmes de ces inégalités est, d’après la façon même dont elle a été obtenue, la limite de
![{\displaystyle {\begin{aligned}&\left[\sum _{0}^{n}\mathrm {L} _{i}\,\delta _{i}p-\sum _{0}^{n}l_{i}\,\delta _{i}n\right]-\left[\sum _{0}^{n}l_{i}\,\delta _{i}p-\sum _{0}^{n}\mathrm {L} _{i}\,\delta _{i}n\right]\\&\quad =\sum _{0}^{n}(\mathrm {L} _{i}-l_{i})(\delta _{i}p-\delta _{i}n)=\sum _{0}^{n}\omega _{i}\,\delta _{i}v{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9b85401721946c9c3c9960748634137b787d48a9)
Or, on a

.
Comparons ces deux différences, on obtient
![{\displaystyle 0\leqq \sum _{0}^{n}\omega _{i}\,\delta _{i}v-\sum _{0}^{n}\omega _{i}\,|\delta _{i}\alpha |=\sum _{0}^{n}\omega _{i}\left[\delta _{i}v-|\delta _{i}\alpha |\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/311e6ee4b3669494721e8cbd0e681e08147956f8)
;
tous les
sont au plus égaux à l’oscillation
de
dans
, les
sont positifs, donc cette quantité est au plus égale à
![{\displaystyle \Omega \sum _{0}^{n}\left[\delta _{i}v-|\delta _{i}\alpha |\right]=\Omega \mathrm {V} -\Omega \sum _{0}^{n}|\delta _{i}\alpha |}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ed0165e4b7a1b29aa8acda1d0de038e6b160a316)
.
Mais on sait (p. 61) que dans les conditions ici considérées
tend vers
. De là résultent les relations suivantes :

;

;

;
donc on a

,

.
Le théorème est démontré et l’on a pour les intégrales par excès et par défaut les expressions
![{\displaystyle {\begin{aligned}\mathrm {E} &={\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[\alpha (x)\right]={\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]-{\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]{\text{,}}\\\mathrm {D} &={\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[\alpha (x)\right]={\underline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[p(x)\right]-{\overline {\int _{a}^{b}}}f(x)\,\mathrm {d} \left[n(x)\right]{\text{.}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/66da26882579dd7daf248df7ab44795bc05155cb)
Pour que nos énoncés se réduisent exactement à ceux du Chapitre II quand on fait
, convenons d’appeler oscillation moyenne de
dans
, prise par rapport à
, la limite du rapport

,
c’est-à-dire le nombre

;
alors la condition nécessaire et suffisante pour que les sommes
tendent[12] vers une limite déterminée, que nous appellerons l’intégrale de Stieltjès-Riemann de
prise par rapport à
, est que
ait une oscillation moyenne, prise par rapport à
, nulle dans l’intervalle considéré.
Du fait que la convergence de
vers zéro est la condition d’intégrabilité, on déduit de suite, comme au Chapitre II, que la condition nécessaire et suffisante pour que
soit intégrable, au sens de Stieltjès-Riemann, par rapport à
, est que l’ensemble des points en lesquels
a une discontinuité au moins égale à
, soit, quel que soit
, un groupe intégrable par rapport à
. En entendant par groupe intégrable par rapport à
, tout ensemble de points qui peut être enfermé à l’intérieur[13] d’intervalles en nombre fini fournissant une somme d’accroissements
de la variation totale aussi petite que l’on veut.
Le mot intérieur est indispensable si
est discontinue ; alors un ensemble réduit à un seul point
n’est pas toujours un groupe intégrable. En effet, si
est point de discontinuité de
, il n’existe pas d’intervalle contenant
à son intérieur et pour lequel
soit inférieur à
. Ainsi les groupes intégrables par rapport à
sont formés de points de continuité de
; une fonction
ne peut être intégrable, au sens de Stieltjès-Riemann, par rapport à
que si elle est continue en tous les points de discontinuité de
. Par contre une fonction peut avoir une intégrale de Stieltjès-Riemann et admettre cependant tous les points d’un intervalle pour points de discontinuité. Il suffit que cet intervalle soit un groupe intégrable par rapport à
, c’est-à-dire qu’il suffit que
soit constante dans cet intervalle. On voit combien la nature des groupes intégrables varie quand varie
.
En utilisant la théorie de la mesure qui va être développée, le lecteur démontrera facilement, comme au Chapitre II, que la condition nécessaire et suffisante pour qu’une fonction ait une intégrale de Stieltjès-Riemann c’est que l’ensemble de ses
points de discontinuité ait, par rapport à la fonction déterminante
, une mesure nulle.
N’étudions pas plus longuement la définition primitive de l’intégrale de Stieltjès et, pour préparer une définition plus large de cette intégrale, définissons la mesure d’un ensemble, prise par rapport à une fonction
à variation bornée.
Nous convenons que la mesure de l’intervalle fermé
est
![{\displaystyle m_{\alpha (x)}\left[l\leqq x\leqq m\right]=\alpha (m+0)-\alpha (l-0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/89c9299c2f49b16f22c40e129eb7b46675fa1090)
,
que la mesure d’un point
est

;
de là on déduit la mesure d’un intervalle ouvert ou à demi ouvert en soustrayant de la mesure d’un intervalle fermé la mesure de l’un ou de l’autre ou de ses deux points extrêmes.
Il est évident que cette fonction d’intervalles est complètement additive ; il lui correspond donc (p. 167), une fonction d’ensemble complètement additive et définie en particulier pour tous les ensembles mesurables B. Nous allons compléter ce résultat.
Rappelons que les ensembles
pour lesquels nous avons défini la fonction
, que nous noterons ici
, sont ceux qui sont transformés en ensembles
mesurables par rapport à
grâce au changement de variable

;
désignant toujours la variation totale de
de
à
; ce changement de variable étant interprété comme il a été expliqué à la page 168.
Dire que
est mesurable, c’est dire qu’on peut l’enfermer dans un ensemble
d’intervalles ouverts, et qu’on peut enfermer son complémentaire
dans un ensemble
d’intervalles ouverts tels que la longueur des parties communes à
et
soit
, aussi petit que l’on veut. À
et
correspondent des ensembles
et
d’intervalles enfermant
et son complémentaire
, si l’on a eu soin de choisir les intervalles constituant
et
de façon qu’aucun d’eux n’ait une extrémité à l’intérieur d’un intervalle
correspondant à un point singulier de
; ce qui est possible puisque ces intervalles sont, chacun, tout entiers dans
ou
[14]. Dans chaque intervalle de l’axe des
on a

,

.
De la première inégalité nous avons déjà déduit que
était mesurable, car elle entraîne
, la sommation étant étendue aux intervalles communs à
et
. La seconde nous donne
et nous montre que les
sont mesurables par rapport à
en convenant que : un ensemble
est dit mesurable par rapport à
s’il peut être enfermé dans une infinité d’intervalles ouverts
et si l’on peut enfermer le complémentaire
de
dans une infinité d’intervalles ouverts
, tels que la somme
, étendue aux intervalles communs à
et
, soit aussi petite que l’on veut.
Ainsi nous avons défini
pour des ensembles qui sont à la fois mesurables au sens ordinaire et mesurables par rapport à
[15] ; si nous nous arrêtions là, la mesurabilité au sens ordinaire jouerait un rôle à part. Nous ne généraliserons complètement la théorie de la mesure qu’en définissant la mesure par rapport à
pour tous les ensembles mesurables par rapport à
, sans exiger de plus qu’ils soient mesurables au sens ordinaire. C’est ce que nous allons faire maintenant[16].
Le problème de la mesure que nous avons résolu au Chapitre VII peut être énoncé comme il suit.
Trouver une fonction d’ensemble qui soit :
1o Positive ou nulle ;
2o Complètement additive ;
3o Qui, pour les intervalles ouverts et fermés, se réduise à la mesure connue de ces intervalles.
Lorsqu’il s’agit de la mesure par rapport à une fonction
non décroissante, on peut conserver exactement cet énoncé. Alors on définit la mesure extérieure de
par la limite inférieure des sommes
relatives aux ensembles d’intervalles enfermant
. La mesure de
diminuée de la mesure extérieure du complémentaire
de
donne la mesure intérieure de
. On voit de suite que la première de ces mesures est au moins égale à la seconde ; ces deux mesures sont égales pour les ensembles mesurables par rapport à
et seulement pour eux. Bref pour
non décroissante, la théorie de la mesure par rapport à
se construit identiquement comme celle de la mesure ordinaire, c’est-à-dire de la mesure pour
.
Mais si
est seulement à variation bornée, la condition 1o ne peut être conservée puisqu’elle n’est même plus vérifiée pour tous les intervalles. Nous la remplacerons par la suivante :
1′ La mesure d’un ensemble par rapport à une fonction non décroissante est positive ou nulle.
La mesure d’un ensemble par rapport à
est au plus égale en valeur absolue à la mesure du même ensemble par rapport à la variation totale
de
.
Si
est un ensemble, enfermons-le dans des suites
,
, … d’ensembles d’intervalles ouverts tels que les sommes