Sur la dynamique de l’électron (juillet)

La bibliothèque libre.
Aller à : navigation, rechercher


Sur la dynamique de l'électron
1906
Rendiconti del Circolo matematico di Palermo 21: 129–176

Adunanza del 23 luglio 1905.
Stampato il 14-16 dicembre 1905


SUR LA DYNAMIQUE DE L’ÉLECTRON ;


Par M. H. Poincaré (Paris).



Adunanza del 23 luglio 1905.



Introduction.

Il semble au premier abord que l'aberration de la lumière et les phénomènes optiques et électriques qui s'y rattachent vont nous fournir un moyen de déterminer le mouvement absolu de la Terre, ou plutôt son mouvement, non par rapport aux autres astres, mais par rapport à l'éther. Fresnel l'avait déjà tenté, mais il reconnut bientôt que le mouvement de la Terre n'altère pas les lois de la réfraction et de la réflexion. Les expériences analogues, comme celle de la lunette pleine d'eau et toutes celles où on ne tient compte que des termes du Ier ordre par rapport à l'aberration, ne donnèrent non plus que des résultats négatifs ; on en découvrit bientôt l'explication ; mais Michelson, ayant imaginé une expérience où les termes dépendant du carré de l'aberration devenaient sensibles, échoua à son tour.

Il semble que cette impossibilité de mettre en évidence expérimentalement le mouvement absolu de la Terre soit une loi générale de la Nature ; nous sommes naturellement portés à admettre cette loi, que nous appellerons le Postulat de Relativité et à l'admettre sans restriction. Que ce postulat, jusqu'ici d'accord avec l'expérience, doive être confirmé ou infirmé plus tard par des expériences plus précises, il est en tout cas intéressant de voir quelles en peuvent être les conséquences.

Une explication a été proposée par Lorentz et Fitz Gerald, qui ont introduit l'hypothèse d'une contraction subie par tous les corps dans le sens du mouvement de la Terre et proportionnelle au carré de l'aberration ; cette contraction, que nous appellerons la contraction lorentzienne, rendrait compte de l'expérience de Michelson et de toutes celles qui ont été réalisées jusqu'ici. L'hypothèse deviendrait insuffisante, toutefois, si on voulait admettre dans toute sa généralité le postulat de relativité.

Lorentz a cherché alors à la compléter et à la modifier de façon à la mettre en concordance parfaite avec ce postulat. C'est ce qu'il a réussi à faire dans son article intitulé Electromagnetic phenomena in a system moving with any velocity smaller than that of light (Proceedings de l'Académie d'Amsterdam, 27 mai 1904).

L'importance de la question m'a déterminé à la reprendre ; les résultats que j'ai obtenus sont d'accord avec ceux de M. Lorentz sur tous les points importants; j'ai été seulement conduit à les modifier et à les compléter dans quelques points de détail; on verra plus loin les différences qui sont d'une importance secondaire.

L'idée de Lorentz peut se résumer ainsi: si on peut, sans qu'aucun des phénomènes apparents soit modifié, imprimer à tout le système une translation commune, c'est que les équations d'un milieu électromagnétique ne sont pas altérées par certaines transformations, que nous appellerons transformations de Lorentz; deux systèmes, l'un immobile, l'autre en translation, deviennent ainsi l'image exacte l'un de l'autre.

Langevin[1] avait cherché à modifier l'idée de Lorentz; pour les deux auteurs, l'électron en mouvement prend la forme d'un ellipsoïde aplati, mais pour Lorentz deux des axes de l'ellipsoïde demeurent constants, pour Langevin au contraire c'est le volume de l'ellipsoïde qui demeure constant. Les deux savants ont d'ailleurs montré que ces deux hypothèses s'accordent avec les expériences de Kaufmann, aussi bien que l'hypothèse primitive d'Abraham (électron sphérique indéformable).

L'avantage de la théorie de Langevin, c'est qu'elle ne fait intervenir que les forces électromagnétiques et les forces de liaison; mais elle est incompatible avec le postulat de relativité; c'est ce que Lorentz avait montré, c'est ce que je retrouve à mon tour par une autre voie en faisant appel aux principes de la théorie des groupes.

Il faut donc en revenir à la théorie de Lorentz; mais si l'on veut la conserver et éviter d'intolérables contradictions, il faut supposer une force spéciale qui explique à la fois la contraction et la constance de deux des axes. J'ai cherché à déterminer cette force, j'ai trouvé qu'elle peut être assimilée à une pression extérieure constante, agissant sur l'électron déformable et compressible, et dont le travail est proportionnel aux variations du volume de cet électron.

Si alors l'inertie de la matière était exclusivement d'origine électromagnétique, comme on l'admet généralement depuis l'expérience de Kaufmann, et qu'à part cette pression constante dont je viens de parler, toutes les forces soient d'origine électromagnétique, le postulat de relativité peut être établi en toute rigueur. C'est ce que je montre par un calcul très simple fondé sur le principe de moindre action.

Mais ce n'est pas tout. Lorentz, dans l'ouvrage cité, a jugé nécessaire de compléter son hypothèse de façon à ce que le postulat subsiste quand il y a d'autres forces que les forces électromagnétiques. D'après lui, toutes les forces, quelle qu'en soit l'origine, sont affectées par la transformation de Lorentz (et par conséquent par une translation) de la même manière que les forces électromagnétiques.

Il importait d'examiner cette hypothèse de plus près et en particulier de rechercher quelles modifications elle nous obligerait à apporter aux lois de la gravitation.

On trouve d'abord qu'elle nous force à supposer que la propagation de la gravitation n'est pas instantanée, mais se fait avec la vitesse de la lumière. On pourrait croire que c'est une raison suffisante pour rejeter l'hypothèse, Laplace ayant démontré qu'il ne peut en être ainsi. Mais en réalité, l'effet de cette propagation est compensé, en grande partie, par une cause différente, de sorte qu'il n'y a plus contradiction entre la loi proposée et les observations astronomiques.

Était-il possible de trouver une loi, qui satisfit à la condition imposée par Lorentz, et qui en même temps se réduisît à la loi de Newton toutes les fois que les vitesses des astres sont assez petites pour qu'on puisse négliger leurs carrés (ainsi que le produit des accélérations par les distances) devant le carré de la vitesse de la Lumière?

A cette question, ainsi qu'on le verra plus loin, on doit répondre affirmativement.

La loi ainsi modifiée est-elle compatible avec les observations astronomiques?

A première vue, il semble que oui, mais la question ne pourra être tranchée que par une discussion approfondie.

Mais en admettant même que cette discussion tourne à l'avantage de la nouvelle hypothèse, que devrons-nous conclure? Si la propagation de l'attraction se fait avec la vitesse de la lumière, cela ne peut être par une rencontre fortuite, cela doit être parce que c'est une fonction de l'éther; et alors il faudra chercher à pénétrer la nature de cette fonction, et la rattacher aux autres fonctions du fluide.

Nous ne pouvons nous contenter de formules simplement juxtaposées et qui ne s'accorderaient que par un hasard heureux; il faut que ces formules arrivent pour ainsi dire à se pénétrer mutuellement. L'esprit ne sera satisfait que quand il croira apercevoir la raison de cet accord, au point d'avoir l'illusion qu'il aurait pu le prévoir.

Mais la question peut encore se présenter à un autre point de vue, qu'une comparaison fera mieux comprendre. Supposons un astronome antérieur à Copernic et réfléchissant sur le système de Ptolémée; il remarquera que pour toutes les planètes, un des deux cercles, épicycle ou déférent, est parcouru dans le même temps. Cela ne peut être par hasard, il y a donc entre toutes les planètes je ne sais quel lien mystérieux.

Mais Copernic, en changeant simplement les axes de coordonnées regardés comme fixes, fait évanouir cette apparence; chaque planète ne décrit plus qu'un seul cercle et les durées des révolutions deviennent indépendantes (jusqu'à ce que Kepler rétablisse entre elles le lien qu'on avait cru détruit).

Ici il est possible qu'il y ait quelque chose d'analogue; si nous admettions le postulat de relativité, nous trouverions dans la loi de gravitation et dans les lois électromagnétiques un nombre commun qui serait la vitesse de la lumière; et nous le retrouverions encore dans toutes les autres forces d'origine quelconque, ce qui ne pourrait s'expliquer que de deux manières:

Ou bien il n'y aurait rien au monde qui ne fût d'origine électromagnétique.

Ou bien cette partie qui serait pour ainsi dire commune à tous les phénomènes physiques ne serait qu'une apparence, quelque chose qui tiendrait à nos méthodes de mesure. Comment faisons-nous nos mesures? En transportant, les uns sur les autres, des objets regardés comme des solides invariables, répondra-t-on d'abord; mais cela n'est plus vrai dans la théorie actuelle, si l'on admet la contraction lorentzienne. Dans cette théorie, deux longueurs égales, ce sont, par définition, deux longueurs que la lumière met le même temps à parcourir.

Peut-être suffirait-il de renoncer à cette définition, pour que la théorie de Lorentz fût aussi complètement bouleversée que l'a été le système de Ptolémée par l'intervention de Copernic. Si cela arrive un jour, cela ne prouvera pas que l'effort fait par Lorentz ait été inutile; car Ptolémée, quoi qu'on en pense, n'a pas été inutile à Copernic.

Aussi n'ai-je pas hésité à publier ces quelques résultats partiels, bien qu'en ce moment même la théorie entière puisse sembler mise en danger par la découverte des rayons magnétocathodiques.


§ 1. — Transformation de Lorentz.


Lorentz a adopté un système particulier d'unités, de façon à faire disparaître les facteurs 4π dans les formules. Je ferai de même, et de plus je choisirai les unités de longueur et de temps de telle façon que la vitesse de la lumière soit égale á 1. Dans ces conditions les formules fondamentales deviennent, en appelant f, g, h le déplacement électrique, α, β, γ la force magnétique, F, G, H le potentiel vecteur, φ le potentiel scalaire, ρ la densité électrique, ξ, η, ζ la vitesse de l'électron, u, v, w le courant:

(1) \begin{cases} u=\frac{df}{dt}+\rho\xi=\frac{d\gamma}{dy}-\frac{d\beta}{dz},\quad\alpha=\frac{dH}{dy}-\frac{dG}{dz},\ f=-\frac{dF}{dt}-\frac{d\psi}{dx},\\ \\\frac{d\alpha}{dt}=\frac{dg}{dz}-\frac{dh}{dy},\quad\frac{d\rho}{dt}+\sum{\textstyle \frac{d\rho\xi}{dx}=0,\quad\sum\frac{df}{dx}=\rho,\quad\frac{d\psi}{dt}+\sum\frac{dF}{dx}=0,}\\ \\\square=\vartriangle-\frac{d^{2}}{dt^{2}}=\sum\frac{d^{2}}{dx^{2}}-\frac{d^{2}}{dt^{2}},\quad\square\psi=-\rho,\quad\square F=-\rho\xi.\end{cases}

Un élément de matière de volume dx dy dz subit une force mécanique dont les composantes X dx dy dz, Y dx dy dz, Z dx dy dz se déduisent de la formule:

(2) X=\rho f+\rho(\eta\gamma-\zeta\beta)\,

Ces équations sont susceptibles d'une transformation remarquable découverte par Lorentz et qui doit son intérêt à ce qu'elle explique pourquoi aucune expérience n'est susceptible de nous faire connaître le mouvement absolu de l'univers. Posons:

(3) x^{\prime}=kl(x+\epsilon t),\ t^{\prime}=kl(t+\epsilon x),\ y^{\prime}=ly,\ z^{\prime}=lz


l et ε étant deux constantes quelconques, et étant

k=\frac{1}{\sqrt{1-\epsilon^{2}}}.

Si alors nous posons:

\square^{\prime}=\sum\frac{d^{2}}{dx^{\prime2}}-\frac{d^{2}}{dt^{\prime2}},


il viendra:

\square^{\prime}=\square l^{-2}.

Considérons une sphère entraînée avec l'électron dans un mouvement de translation uniforme et soit:

(x-\xi t)^{2}+(y-\eta t)^{2}+(z-\zeta t)^{2}=r^{2},\,


l’équation de cette sphère mobile dont le volume sera \frac{4}{3}\pi r^{3}.

La transformation la changera en un ellipsoïde, dont il est aisé de trouver l'équation. On déduit aisément en effet des équations (3):

(3bis) x=\frac{k}{l}(x^{\prime}-\epsilon t^{\prime}),\ t=\frac{k}{l}(t^{\prime}-\epsilon x^{\prime}),\ y=\frac{y^{\prime}}{l},\ z=\frac{z^{\prime}}{l}.

L'équation de l'ellipsoïde devient ainsi:

k^{2}(x^{\prime}-\epsilon t^{\prime}-\xi t^{\prime}+\epsilon\xi x^{\prime})^{2}+(y^{\prime}-\eta kt^{\prime}+\eta k\epsilon x^{\prime})^{2}+(z^{\prime}-\zeta kt^{\prime}+\zeta k\epsilon x^{\prime})^{2}=l^{2}r^{2}.

Cet ellipsoïde se déplace avec un mouvement uniforme; pour t'=0, il se réduit à

k^{2}x^{\prime2}(1+\xi\epsilon)^{2}+(y^{\prime}+\eta k\epsilon x^{\prime})^{2}+(z^{\prime}+\zeta k\epsilon x^{\prime})^{2}=l^{2}r^{2},


et a pour volume:

\frac{4}{3}\pi r^{3}\frac{l^{3}}{k(1+\xi\epsilon)}.

Si l'on veut que la charge d'un électron ne soit pas altérée par la transformation et si l'on appelle ρ' la nouvelle densité électrique, il viendra:

(4) \rho^{\prime}=\frac{k}{l^{3}}(\rho+\epsilon\rho\xi).

Que seront maintenant les nouvelles vitesses ξ', η', ζ'; on devra avoir:

\xi^{\prime}=\frac{dx^{\prime}}{dt^{\prime}}=\frac{d(x+\epsilon t)}{d(t+\epsilon x)}=\frac{\xi+\epsilon}{1+\epsilon\xi},

\eta^{\prime}=\frac{dy^{\prime}}{dt^{\prime}}=\frac{dy}{kd(t+\epsilon x)}=\frac{\eta}{k(1+\epsilon\xi)},\quad\zeta^{\prime}=\frac{\zeta}{k(1+\epsilon\xi)},


d'où:

(4bis) \rho^{\prime}\xi^{\prime}=\frac{k}{l^{3}}(\rho\xi+\epsilon\rho),\quad\rho^{\prime}\eta^{\prime}=\frac{1}{l^{3}}\rho\eta,\quad\rho^{\prime}\zeta^{\prime}=\frac{1}{l^{3}}\rho\zeta

C'est ici que je dois signaler pour la première fois une divergence avec Lorentz.

Lorentz pose (à la différence des notations près) (loco citato, page 813, formules 7 et 8):

\rho^{\prime}=\frac{1}{kl^{3}}\rho,\quad\xi^{\prime}=k^{2}(\xi+\epsilon),\quad\eta^{\prime}=k\eta,\quad\zeta^{\prime}=k\zeta.

On retrouve ainsi les formules:

\rho^{\prime}\xi^{\prime}=\frac{k}{l^{3}}(\rho\xi+\epsilon\rho),\quad\rho^{\prime}\eta^{\prime}=\frac{1}{l^{3}}\rho\eta,\quad\rho^{\prime}\zeta^{\prime}=\frac{1}{l^{3}}\rho\zeta;


mais la valeur de ρ' diffère.

Il importe de remarquer que les formules (4) et (4 bis) satisfont à la condition de continuité

\frac{d\rho^{\prime}}{dt^{\prime}}+\sum\frac{d\rho^{\prime}\xi^{\prime}}{dx^{\prime}}=0.

Soit en effet λ une quantité indéterminée et D le déterminant fonctionnel de

(5) t+\lambda\rho,\ x+\lambda\rho\xi,\ x+\lambda\rho\eta,\ z+\lambda\rho\zeta


par rapport à t, x, y, z. On aura:

D=D_{0}+D_{1}\lambda+D_{2}\lambda^{2}+D_{3}\lambda^{3}+D_{4}\lambda^{4}\,
avec D_{0}=1,\, D_{1}=\frac{d\rho}{dt}+\sum\frac{d\rho\xi}{dx}=0.

Soit λ'=l²λ, nous voyons que les 4 fonctions

(5bis) t^{\prime}+\lambda^{\prime}\rho^{\prime},\ x^{\prime}+\lambda^{\prime}\rho^{\prime}\xi^{\prime},\ y^{\prime}+\lambda^{\prime}\rho^{\prime}\eta^{\prime},\ z^{\prime}+\lambda^{\prime}\rho^{\prime}\zeta^{\prime}


sont liées aux fonctions (5) par les mêmes relations linéaires que les variables anciennes aux variables nouvelles. Si donc on désigne par D' le déterminant fonctionnel des fonctions (5 bis) par rapport aux variables nouvelles, on aura:

D^{\prime}=D,\ D^{\prime}=D_{0}^{\prime}+D_{1}^{\prime}\lambda^{\prime}+\ldots+D_{4}^{\prime}\lambda^{\prime4},


d'où:

 D_{0}^{\prime}=D_{0}=1,\ D_{1}^{\prime}=l^{-2}D_{1}=0=\frac{d\rho^{\prime}}{dt^{\prime}}+\sum\frac{d\rho^{\prime}\xi^{\prime}}{dx^{\prime}}. C. Q. F. D

Avec l'hypothèse de Lorentz, cette condition ne serait pas remplie, puisque ρ' n'a pas la même valeur.

Nous définirons les nouveaux potentiels, vecteur et scalaire, de façon à satisfaire aux conditions

(6) \square^{\prime}\psi^{\prime}=-\rho^{\prime},\quad\square^{\prime}F^{\prime}=-\rho^{\prime}\xi^{\prime}.

Nous tirerons ensuite de là:

(7) \psi^{\prime}=\frac{k}{l}(\psi+\epsilon F),\ F^{\prime}=\frac{k}{l}(F+\epsilon\psi),\ G^{\prime}=\frac{1}{l}G,\ H^{\prime}=\frac{1}{l}H.

Ces formules diffèrent notablement de celles de Lorentz, mais la divergence ne porte en dernière analyse que sur les définitions.

Nous choisirons les nouveaux champs électrique et magnétique de façon à satisfaire aux équations:

(8) f^{\prime}=-\frac{dF^{\prime}}{dt^{\prime}}-\frac{d\psi^{\prime}}{dx^{\prime}},\quad\alpha^{\prime}=\frac{dH^{\prime}}{dy^{\prime}}-\frac{dG^{\prime}}{dz^{\prime}}.

Il est aisé de voir que:

\frac{d}{dt^{\prime}}=\frac{k}{l}\left(\frac{d}{dt}-\epsilon\frac{d}{dx}\right),\quad\frac{d}{dx^{\prime}}=\frac{k}{l}\left(\frac{d}{dx}-\epsilon\frac{d}{dt}\right),\quad\frac{d}{dy^{\prime}}=\frac{1}{l}\frac{d}{dy},\quad\frac{d}{dz^{\prime}}=\frac{1}{l}\frac{d}{dz}


et on en conclut:

(9) \begin{cases}
f^{\prime}=\frac{1}{l^{2}}f,\ g^{\prime}=\frac{k}{l^{2}}(g+\epsilon\gamma),\ h^{\prime}=\frac{k}{l^{2}}(h-\epsilon\beta),\\
\\
\alpha^{\prime}=\frac{1}{l^{2}}\alpha,\quad\beta^{\prime}=\frac{k}{l^{2}}(\beta-\epsilon h),\quad\gamma^{\prime}=\frac{k}{l^{2}}(\gamma+\epsilon g).
\end{cases}

Ces formules sont identiques à celles de Lorentz.

Notre transformation n'altère pas les équations (I). En effet, la condition de continuité, ainsi que les équations (6) et (8), nous fournissent déjà quelques-unes des équations (I) (sauf l'accentuation des lettres).

Les équations (6) rapprochées de la condition de continuité donnent:

(10) \frac{d\psi^{\prime}}{dt^{\prime}}+\sum\frac{dF^{\prime}}{dx^{\prime}}=0.

Il reste à établir que:

\frac{df^{\prime}}{dt^{\prime}}+\rho^{\prime}\xi^{\prime}=\frac{d\gamma^{\prime}}{dy^{\prime}}-\frac{d\beta^{\prime}}{dz^{\prime}},\quad\frac{dz^{\prime}}{dt^{\prime}}=\frac{dg^{\prime}}{dz^{\prime}}-\frac{dh^{\prime}}{dy^{\prime}},\quad\sum\frac{df^{\prime}}{dx^{\prime}}=\rho^{\prime}


et l'on voit aisément que ce sont des conséquences nécessaires des équations (6), (8) et (10).

Nous devons maintenant comparer les forces avant et après la transformation.

Soient X, Y, Z la force avant, et X', Y', Z' la force après la transformation, toutes deux rapportées à l'unite de volume. Pour que X' satisfasse aux mêmes équations qu'avant la transformation, on doit avoir:

\begin{array}{l}
X^{\prime}=\rho^{\prime}f^{\prime}+\rho^{\prime}(\eta^{\prime}\gamma^{\prime}-\zeta^{\prime}\beta^{\prime}),\\
Y^{\prime}=\rho^{\prime}g^{\prime}+\rho^{\prime}(\zeta^{\prime}\alpha^{\prime}-\xi^{\prime}\gamma^{\prime}),\\
X^{\prime}=\rho^{\prime}h^{\prime}+\rho^{\prime}(\xi^{\prime}\beta^{\prime}-\eta^{\prime}\alpha^{\prime}),
\end{array}


ou, en remplaçant toutes les quantités par leurs valeurs (4), (4bis) et (9) et tenant compte des équations (2):

(11) \begin{cases} X^{\prime}=\frac{k}{l^{5}}(X+\epsilon\sum X\xi),\\ \\Y^{\prime}=\frac{1}{l^{5}}Y,\\ \\Z^{\prime}=\frac{1}{l^{5}}Z.\end{cases}

Si nous représentions par X1, Y1, Z1 les composantes de la force rapportée, non plus à l'unité de volume, mais à l'unite de charge électrique de l'èlectron, et par X'1, Y'1, Z'1 les mêmes quantités après la transformation, nous aurions:

X_{1}=f+\eta\gamma-\zeta\beta,\ X_{1}^{\prime}=f^{\prime}+\eta^{\prime}\gamma^{\prime}-\zeta^{\prime}\beta^{\prime},\ X=\rho X_{1,}\ X^{\prime}=\rho^{\prime}X_{1}^{\prime}
et nous aurions les équations
(11bis) \begin{cases} X_{1}^{\prime}=\frac{k}{l^{5}}\frac{\rho}{\rho^{\prime}}(X_{1}+\epsilon\sum X_{1}\xi),\\ \\Y_{1}^{\prime}=\frac{1}{l^{5}}\frac{\rho}{\rho^{\prime}}Y_{1},\\ \\Z_{1}^{\prime}=\frac{1}{l^{5}}\frac{\rho}{\rho^{\prime}}Z_{1}.\end{cases}

Lorentz avait trouvé [à la différence des notations près, page 813, formule (10)]:

(11ter) \begin{cases} X_{1}=l^{2}X_{1}^{\prime}-l^{2}\epsilon(\eta^{\prime}g^{\prime}+\zeta^{\prime}h^{\prime}),\\ \\Y_{1}=\frac{l^{2}}{k}Y_{1}^{\prime}+\frac{l^{2}\epsilon}{k}\xi^{\prime}g^{\prime},\\ \\Z_{1}=\frac{l^{2}}{k}Z_{1}^{\prime}+\frac{l^{2}\epsilon}{k}\xi^{\prime}h^{\prime}.\end{cases}

Avant d'aller plus loin, il importe de rechercher la cause de cette importante divergence. Elle tient évidemment à ce que les formules pour ξ', η', ζ' ne sont pas les mêmes, tandis que les formules pour les champs électriques et magnétiques sont les mêmes.

Si l'inertie des électrons est exclusivement d'origine électromagnétique, si de plus ils ne sont soumis qu'à des forces d'origine électromagnétique, la condition d'équilibre exige que l'on ait à l'intérieur des électrons:

X = Y = Z = 0.\,

Or en vertu des équations (11) ces relations équivalent à

X' = Y' = Z' = 0.\,

Les conditions d'équilibre des électrons ne sont donc pas altérées par la transformation.

Malheureusement une hypothèse aussi simple est inadmissible. Si, en effet, on suppose ξ=ηζ=0, les conditions X = Y = Z = 0 entraîneraient f=g=h =o, et par conséquent \sum\frac{df}{dx}=0, c'est-à-dire ρ=0. On arriverait à des résultats analogues dans le cas le plus général. Il faut donc bien admettre qu'il y a outre les forces électromagnétiques, soit d'autres forces, soit des liaisons. Il faut alors chercher à quelles conditions doivent satisfaire ces forces ou ces liaisons, pour que l'équilibre des électrons ne soit pas troublé par la transformation. Ce sera l'objet d'un paragraphe ultérieur.


§ 2. — Principe de moindre action.

On sait comment Lorentz a déduit ses équations du principe de moindre action. Je reviendrai cependant sur la question, bien que je n'aie rien d'essentiel à ajouter à l'analyse de Lorentz, parce que je préfère la présenter sous une forme un peu différente qui me sera utile pour mon objet. Je poserai:

(1) J=\int dt\ d\tau\left[\frac{\sum f^{2}}{2}+\frac{\sum\alpha^{2}}{2}-\sum Fu\right],
en supposant que f, α, F, u, etc. sont assujetties aux conditions suivantes et à celles qu'on en déduirait par symétrie:
(2) \sum\frac{df}{dx}=\rho,\quad\alpha=\frac{dH}{dy}-\frac{dG}{dz},\quad u=\frac{df}{dt}+\rho\xi.

Quant à l'intégrale J elle doit être étendue:

I° par rapport à l'élément de volume dτ=dx dy dz à l'espace tout entier;

2° par rapport au temps t, à l'intervalle compris entre les limites t=t0, t=t1.

D'après le principe de moindre action, l'intégrale J doit être un minimum, si l'on assujettit les diverses quantités qui y figurent:

1° aux conditions (2);

2° à la condition que l'état du système soit déterminé aux deux époques limites t=t0, t=t1.

Cette dernière condition nous permet de transformer nos intégrales par intégration par parties par rapport au temps. Si nous avons en effet une intégrale de la forme

\int dt\ d\tau A\frac{dB\delta C}{dt},


où C est une des quantités qui définissent l'état du système et δC sa variation, elle sera égale (en intégrant par parties par rapport au temps):

\int d\tau\mid AB\delta C\mid{t=t_{1}\atop t=t_{0}}-\int dt\ d\tau\frac{dA}{dt}dB\delta C.

Comme l'état du système est déterminé aux deux époques limites, on a δC=0 pour t=t0, t=t1; donc la 1ere intégrale qui se rapporte à ces deux époques est nulle, et la 2de subsiste seule.

Nous pouvons de même intégrer par parties par rapport à x, y ou z; nous avons en effet

\int A\frac{dB}{dx}dx\ dy\ dz\ dt=\int AB\ dy\ dz\ dt-\int B\frac{dA}{dx}dx\ dy\ dz\ dt.

Nos intégrations s'étendant jusqu'à l'infini, il faut faire x=\pm\infty dans la 1ere intégrale du 2de membre; donc, comme nous supposons toujours que toutes nos fonctions s'annulent à l'infini, cette intégrale sera nulle et il viendra

\int A\frac{dB}{dx}d\tau\ dt=-\int B\frac{dA}{dx}d\tau\ dt.

Si le système était supposé soumis à des liaisons, il faudrait adjoindre ces conditions de liaison aux conditions imposées aux diverses quantités qui figurent dans l'intégrale J.

Donnons d'abord à F, G, H des accroissements δF, δG, δH; d'où:

\delta\alpha=\frac{d\delta H}{dy}-\frac{d\delta G}{dz}.

On devra avoir

\delta J=\int dt\ d\tau\left[\sum\alpha\left(\frac{d\delta H}{dy}-\frac{d\delta G}{dz}\right)-\sum u\delta F\right]=0,


ou, en intégrant par parties,

\delta J=\int dt\ d\tau\left[\sum\left(\delta G\frac{d\alpha}{dz}-\delta H\frac{d\alpha}{dy}\right)-\sum u\delta F\right]=

=-\int dt\ d\tau\sum\delta F\left(u-\frac{d\gamma}{dy}+\frac{d\beta}{dz}\right)=0


d'où, en égalant à zéro le coefficient de l'arbitraire δF,

(3) u=\frac{d\gamma}{dy}-\frac{d\beta}{dz}.

Cette relation nous donne (avec une intégration par parties):

\int\sum Fud\tau=\int\sum F\left(\frac{d\gamma}{dy}-\frac{d\beta}{dz}\right)d\tau=\int\sum\left(\beta\frac{dF}{dz}-\gamma\frac{dF}{dy}\right)d\tau=

=\int\sum\alpha\left(\frac{dH}{dy}-\frac{dG}{dz}\right)d\tau,


ou

\int\sum Fud\tau=\int\sum\alpha^{2}d\tau,


d'où enfin:

(4) J=\int dt\ d\tau\left(\frac{\sum f^{2}}{2}-\frac{\sum\alpha^{2}}{2}\right).

Désormais, et grâce à la relation (3), δJ est indépendant de δF et par conséquent de δα; faisons varier maintenant les autres variables.

Il vient, en revenant à l'expression (1) de J,

\delta J=\int dt\ d\tau\left(\sum f\delta f-\sum F\delta u\right).

Mais f, g, h sont assujettis à la 1ere des conditions (2), de sorte que

(5) \sum\frac{d\delta f}{dx}=\delta\rho


et qu'il convient d'écrire:

(6) \delta J=\int dt\ d\tau\left[\sum fdf-\sum F\delta u-\psi\left(\sum\frac{d\delta f}{dx}-\delta\rho\right)\right].

Les principes du calcul des variations nous apprennent que l'on doit faire le calcul comme si, ψ étant une fonction arbitraire, δJ était représente par l'expression (6) et si les variations n'étaient plus assujetties à la condition (5).

Nous avons d'autre part

\delta u=\frac{d\delta f}{dt}+\delta\rho\xi,


d'où, après intégration par parties,

(7) \delta J=\int dt\ d\tau\sum\delta f\left(f+\frac{dF}{dt}+\frac{d\psi}{dx}\right)+\int dt\ d\tau\left(\psi\delta\rho-\sum F\delta\rho\xi\right).

Si nous supposons d'abord que les électrons ne subissent pas de variation, δρ=δρξ=0 et la seconde intégrale est nulle. Comme δJ doit s'annuler, on doit avoir:

(8) f+\frac{dF}{dt}+\frac{d\psi}{dx}=0

Il reste donc dans le cas général:

(9) \delta J=\int dt\ d\tau\left(\psi\delta\rho-\sum F\delta\rho\xi\right).

Il reste à déterminer les forces qui agissent sur les électrons. Pour cela nous devons supposer qu'on applique à chaque élément d'électron une force complémentaire -Xdτ, -Ydτ, -Zdτ, et écrire que cette force fait équilibre aux forces d'origine électromagnétique. Soit U, V, W les composantes du déplacement de l'élément dτ d'électron, déplacement compté à partir d'une position initiale quelconque. Soient δU, δV, δW les variations de ce déplacement; le travail virtuel correspondant de la force complémentaire sera:

-\int\sum X\delta U\ d\tau,


de sorte que la condition d'équilibre dont nous venons de parler s'écrira:

(10) \delta J=-\int\sum X\delta U\ d\tau\ dt.

Il s'agit de transformer δJ. Pour cela commençons par chercher l'équation de continuité exprimant que la charge d'un électron se conserve par la variation.

Soient x0, y0, z0 la position initiale d'un électron. Sa position actuelle sera:

x=x_{0}+U,\quad y=y_{0}+V,\quad z=z_{0}+W.

Nous introduirons en outre une variable auxiliaire ε, qui produira les variations de nos diverses fonctions, de sorte que, pour une fonction A quelconque, on ait:

\delta A=\delta\epsilon\frac{dA}{d\epsilon}

Il me sera commode en effet de pouvoir passer de la notation du calcul des variations, à celle du calcul différentiel ordinaire, ou inversement.

Nos fonctions pourront être regardées: 1° soit comme dépendant des cinq variables x, y, z, t, ε, de telle sorte qu'on reste toujours à la même place quand t et ε varient seuls: nous désignerons alors leurs dérivées par des d ordinaires; 2° soit comme dépendant des cinq variables x0, y0, z0, t, ε de telle sorte qu'on suive toujours un même électron quand t et ε varient seuls; nous désignerons alors leurs dérivées par des ∂ ronds. On aura alors:

(11) \xi=\frac{\partial U}{\partial t}=\frac{dU}{dt}+\xi\frac{dU}{dx}+\eta\frac{dU}{dy}+\zeta\frac{dU}{dz}=\frac{\partial x}{\partial t}.

Désignons maintenant per Δ le déterminant fonctionnel de x, y, z par rapport à x0, y0, z0:

\Delta=\frac{\partial(x,\ y,\ z)}{\partial(x_{0},\ y_{0},\ z_{0})}.

Si ε, x0, y0, z0 restant constants nous donnons à t un accroissement ∂t, il en résultera pour x, y, z des accroissements ∂x0, ∂y0, ∂z0, et pour Δ un accroissement ∂Δ, et on aura:

\partial x=\xi\partial t,\quad\partial y=\eta\partial t,\quad\partial z=\zeta\partial t,

\Delta+\partial\Delta=\frac{\partial(x+\partial x,\ y+\partial y,\ z+\partial z)}{\partial(x_{0},\ y_{0},\ z_{0})}


d'où

1+\frac{\partial\Delta}{\Delta}=\frac{\partial(x+\partial x,\ y+\partial y,\ z+\partial z)}{\partial(x,\ y,\ z)}=\frac{\partial(x+\xi\partial t,\ y+\eta\partial t,\ z+\zeta\partial t)}{\partial(x,\ y,\ z)}

On en déduit:

(12) \frac{1}{\Delta}\frac{\partial\Delta}{\partial t}=\frac{d\xi}{dx}+\frac{d\eta}{dy}+\frac{d\zeta}{dz}

La masse de chaque électron étant invariable, on aura:

(13) \frac{\partial\rho\Delta}{\partial t}=0


d'où:

\frac{\partial\rho}{\partial t}+\sum\rho\frac{d\xi}{dx}=0,\quad\frac{\partial\rho}{\partial t}=\frac{d\rho}{dt}+\sum\xi\frac{d\rho}{dx},\quad\frac{d\rho}{dt}+\sum\frac{d\rho\xi}{dx}=0.

Telles sont les différentes formes de l'équation de continuité en ce qui concerne la variable t. Nous trouvons des formes analogues en ce qui concerne la variable ε. Soit:

\delta U=\frac{\partial U}{\partial\epsilon}\delta\epsilon,\quad\delta V=\frac{\partial V}{\partial\epsilon}\delta\epsilon,\quad\delta W=\frac{\partial W}{\partial\epsilon}\delta\epsilon;


il viendra:

(11bis) \delta U=\frac{dU}{d\epsilon}\delta\epsilon+\delta U\frac{dU}{dx}+\delta V=\frac{dU}{dy}+\delta W\frac{dU}{dz},
(12bis) \frac{1}{\Delta}\frac{\partial\Delta}{\partial\epsilon}=\sum\frac{dU}{d\epsilon},\quad\frac{\partial\rho\Delta}{\partial\epsilon}=0,
(13bis) \delta\epsilon\frac{\partial\rho}{\partial\epsilon}+\sum\rho\frac{d\rho U}{dx}=0,\quad\frac{\partial\rho}{\partial\epsilon}=\frac{d\rho}{d\epsilon}+\sum\frac{\delta U}{\delta\epsilon}\frac{d\rho}{dx},\quad\delta\rho+\frac{d\rho\delta U}{dx}=0.

On remarquera la différence entre la définition de \delta U=\frac{dU}{d\epsilon}\delta\epsilon et celle de \delta\rho=\frac{d\rho}{d\epsilon}\delta\epsilon; on remarquera que c'est bien cette définition de δU qui convient à la formule (10).

Cette dernière équation va nous permettre de transformer le 1ere terme de (9); nous trouvons en effet:

\int dt\ d\tau\ \psi\delta\rho=-\int dt\ d\tau\ \psi\sum\frac{d\rho\delta U}{dx},

ou, en intégrant par parties,
(14bis) \int dt\ d\tau\ \psi\delta\rho=\int dt\ d\tau\sum\rho\frac{d\psi}{dx}\delta U.

Proposons-nous maintenant de déterminer

\delta(\rho\xi)=\frac{d(\rho\xi)}{d\epsilon}\delta\epsilon.

Observons que δΔ ne peut dépendre que de x0, y0, z0; en effet, si l'on considère un élément d'électron dont la position initiale est un parallélipipède rectangle dont les arêtes sont dx0, dy0, dz0 la charge de cet élément est

\rho\Delta dx_{0\ }dy_{0\ }dz_{0\ }


et, cette charge devant demeurer constante, on a:

(15) \frac{\partial\rho\Delta}{\partial t}=\frac{\partial\rho\Delta}{\partial\epsilon}=0.

On en déduit:

(16) \frac{\partial^{2}\rho\Delta U}{\partial t\ \partial\epsilon}=\frac{\partial}{\partial\epsilon}\left(\rho\Delta\frac{\partial U}{\partial t}\right)=\frac{\partial}{\partial t}\left(\rho\Delta\frac{\partial U}{\partial\epsilon}\right).

Or on sait que pour une fonction A quelconque on a, par l'équation de continuité,

\frac{1}{\Delta}\frac{\partial A\Delta}{\partial t}=\frac{dA}{dt}+\sum\frac{dA\xi}{dx}


et de même

\frac{1}{\Delta}\frac{\partial A\Delta}{\partial\epsilon}=\frac{dA}{d\epsilon}+\sum\frac{dA\frac{\partial U}{\partial\epsilon}}{dx}

On a donc

(17) \frac{1}{\Delta}\frac{\partial}{\partial\epsilon}\left(\rho\Delta\frac{\partial U}{\partial t}\right)=\frac{d\rho\frac{\partial U}{\partial t}}{d\epsilon}+\frac{d\left(\rho\frac{\partial U}{\partial t}\frac{\partial U}{\partial\epsilon}\right)}{dx}+\frac{d\left(\rho\frac{\partial U}{\partial t}\frac{\partial V}{\partial\epsilon}\right)}{dy}+\frac{d\left(\rho\frac{\partial U}{\partial t}\frac{\partial W}{\partial\epsilon}\right)}{dz},
(17bis) \frac{1}{\Delta}\frac{\partial}{\partial t}\left(\rho\Delta\frac{\partial U}{\partial\epsilon}\right)=\frac{d\rho\frac{\partial U}{\partial\epsilon}}{dt}+\frac{d\left(\rho\frac{\partial U}{\partial t}\frac{\partial U}{\partial\epsilon}\right)}{dx}+\frac{d\left(\rho\frac{\partial V}{\partial t}\frac{\partial U}{\partial\epsilon}\right)}{dy}+\frac{d\left(\rho\frac{\partial W}{\partial t}\frac{\partial U}{\partial\epsilon}\right)}{dz}.

Les 2ds membres de (17) et (17 bis) doivent être égaux et, si l'on se souvient que

\frac{\partial U}{\partial t}=\xi,\quad\frac{\partial U}{\partial\epsilon}\delta\epsilon=\delta U,\quad\frac{d\rho\xi}{d\epsilon}\delta\epsilon=\delta\rho\xi


il vient:

(18) \delta\rho\xi+\frac{d(\rho\xi\delta U)}{dx}+\frac{d(\rho\xi\delta V)}{dy}+\frac{d(\rho\xi\delta W)}{dz}=\frac{d(\rho\delta U)}{dt}+\frac{d(\rho\xi\delta U)}{dx}+\frac{d(\rho\eta\delta U)}{dy}+\frac{d(\rho\zeta\delta U)}{dz}

Transformons maintenant le 2d terme de (9); il vient:

\int dt\ d\tau\sum F\delta\rho\xi

=\int dt\ d\tau\left[\sum F\frac{d(\rho\delta U)}{dt}+\sum F\frac{d(\rho\eta\delta U)}{dy}+\sum F\frac{d(\rho\zeta\delta U)}{dz}-\sum F\frac{d(\rho\xi\delta V)}{dy}-\sum F\frac{d(\rho\xi\delta W)}{dz}\right].

Le second membre devient, par l'intégration par parties:

\int dt\ d\tau\left[-\sum\rho\delta U\frac{dF}{dt}-\sum\rho\eta\delta U\frac{dF}{dy}-\sum\rho\zeta\delta U\frac{dF}{dz}+\sum\rho\xi\delta V\frac{dF}{dy}+\sum\rho\xi\delta W\frac{dF}{dz}\right].

Remarquons maintenant que:

\sum\rho\xi\delta V\frac{dF}{dy}=\sum\rho\zeta\delta U\frac{dH}{dx},\quad\sum\rho\xi\delta W\frac{dF}{dz}=\sum\rho\eta\delta U\frac{dG}{dx}

Si, en effet, dans les deux membres de ces relations, on développe les Σ, elles deviennent des identités; et souvenons-nous que

\frac{dH}{dx}-\frac{dF}{dz}=-\beta,\quad\frac{dG}{dx}-\frac{dF}{dy}=\gamma


le second membre en question deviendra:

\int dt\ d\tau\left[-\sum\rho\delta U\frac{dF}{dt}-\sum\rho\gamma\eta\delta U-\sum\rho\beta\zeta\delta U\right],


de sorte que finalement:

\delta J=\int dt\ d\tau\sum\rho\delta U\left(\frac{d\psi}{dx}+\frac{dF}{dt}+\beta\zeta-\gamma\eta\right)=\int dt\ d\tau\sum\rho\delta U\left(-f+\beta\zeta-\gamma\eta\right).

En égalant le coefficient de δU dans les deux membres de (10) il vient:

X=f-\beta\zeta+\gamma\eta\,

C'est l'équation (2) du § précédent.


§ 3. — La transformation de Lorentz et le principe de moindre action.

Voyons si le principe de moindre action nous donne la raison du succès de la transformation de Lorentz. Il faut d'abord voir ce que cette transformation fait de l'intégrale:

J=\int dt\ d\tau\left(\frac{\sum f^{2}}{2}-\frac{\sum\alpha^{2}}{2}\right)


(formule 4 du § 2).

Nous trouvons d'abord

dt^{\prime}\ d\tau^{\prime}=l^{4}dt\ d\tau


car x', y', y', z', t' sont liés x, y, z, t par des relations linéaires dont le déterminant est égal à l4; il vient ensuite:

(1) \begin{cases} l^{4}\sum f^{\prime2}=f^{2}+k^{2}(g^{2}+h^{2})+k^{2}\epsilon^{2}(\beta^{2}+\gamma^{2})+2k^{2}\epsilon(g\gamma-h\beta)\\ \\l^{4}\sum\alpha^{\prime2}=\alpha^{2}+k^{2}(\beta^{2}+\gamma^{2})+k^{2}\epsilon^{2}(g^{2}+h^{2})+2k^{2}\epsilon(g\gamma-h\beta)\end{cases}


(formules 9 du § 1), d'où:

l^{4}\left(\sum f^{\prime2}-\sum\alpha^{\prime2}\right)=\sum f^{2}-\sum\alpha^{2}

de sorte que si l'on pose:
J^{\prime}=\int dt^{\prime}\ d\tau^{\prime}\left(\frac{\sum f^{\prime2}}{2}-\frac{\sum\alpha^{\prime2}}{2}\right),


il vient:

J' = J.

Il faut toutefois, pour que cette égalité soit justifiée, que les limites d'intégration soient les mêmes; jusqu'ici nous avons admis que t variait depuis t0 jusqu'à t1, et x, y, z depuis ∞ jusqu'à + ∞. A ce compte les limites d'intégration seraient altérées par la transformation de Lorentz; mais rien ne nous empêche de supposer t0=-∞, t1=+∞; avec ces conditions les limites sont les mêmes pour J et pour J'.

Nous avons alors à comparer les deux équations suivantes analogues à l'équation (10) du § 2:

(2) \begin{cases} \delta J=-\int\sum X\delta U\ d\tau\ dt\\ \\\delta J=-\int\sum X^{\prime}\delta U^{\prime}\ d\tau^{\prime}\ dt^{\prime}.\end{cases}

Pour cela, il faut d'abord comparer δU' à δU.

Considérons un électron dont les coordonnées initiales sont x0, y0, z0; ses coordonnées à l'instant t, seront

x=x_{0}+U,\quad y=y_{0}+V,\quad z=z_{0}+W.

Si on considère l'électron correspondant après la transformation de Lorentz, il aura pour coordonnées

x^{\prime}=kl\left(x+\epsilon t\right),\quad y^{\prime}=ly,\quad z^{\prime}=lz


x^{\prime}=x_{0}+U^{\prime},\quad y^{\prime}=y_{0}+V^{\prime},\quad z^{\prime}=z_{0}+W^{\prime}


mais il n'atteindra ces coordonnées qu'à l'instant

t^{\prime}=kl\left(t+\epsilon x\right).

Si nous faisons subir à nos variables des variations δU, δV, δW et que nous donnions en même temps à t un accroissement δt, les coordonnées x, y, z subiront un accroissement total

\delta x=\delta U+\xi\delta t,\quad\delta y=\delta V+\eta\delta t,\quad\delta z=\delta W+\zeta\delta t.

Nous aurons de même:

\delta x^{\prime}=\delta U^{\prime}+\xi^{\prime}\delta t^{\prime},\quad\delta y^{\prime}=\delta V^{\prime}+\eta^{\prime}\delta t^{\prime},\quad\delta z^{\prime}=\delta W^{\prime}+\zeta^{\prime}\delta t^{\prime},


et en vertu de la transformation de Lorentz:

\delta x^{\prime}=kl\left(\delta x+\epsilon\delta t\right),\quad\delta y^{\prime}=l\delta y,\quad\delta z^{\prime}=l\delta z,\quad\delta t^{\prime}=kl\left(\delta t+\epsilon\delta x\right).


d'où, en supposant δt=0, les relations:

\delta x^{\prime}=\delta U^{\prime}+\xi^{\prime}\delta t^{\prime}=kl\delta U,

\delta y^{\prime}=\delta V^{\prime}+\eta^{\prime}\delta t^{\prime}=l\delta V,

\delta t^{\prime}=kl\epsilon\delta U.

Remarquons que

\xi^{\prime}=\frac{\xi+\epsilon}{1+\xi\epsilon},\quad\eta^{\prime}=\frac{\eta}{k\left(1+\xi\epsilon\right)}


il viendra, en remplaçant δt' par sa valeur,

kl\left(1+\xi\epsilon\right)\delta U=\delta U^{\prime}\left(1+\xi\epsilon\right)+\left(\xi+\epsilon\right)kl\epsilon\delta U,

l\left(1+\xi\epsilon\right)\delta V=\delta V^{\prime}\left(1+\xi\epsilon\right)+\eta l\epsilon\delta U.

Si nous nous rappelons la définition de k, nous tirerons de là:

\delta U=\frac{k}{l}\delta U^{\prime}+\frac{k\epsilon}{l}\xi\delta U^{\prime},

\delta V=\frac{1}{l}\delta V^{\prime}+\frac{k\epsilon}{l}\eta\delta U^{\prime},


et de même

\delta W=\frac{1}{l}\delta W^{\prime}+\frac{k\epsilon}{l}\zeta\delta U^{\prime};


d'où

(3) \sum X\delta U=\frac{1}{l}\left(kX\delta U^{\prime}+Y\delta V^{\prime}+Z\delta W^{\prime}\right)+\frac{k\epsilon}{l}\delta U^{\prime}\sum X\xi.

Or, en vertu des équations (2) on doit avoir:

\int\sum X^{\prime}\delta U^{\prime}dt^{\prime}\ d\tau^{\prime}=\int\sum X\delta U\ dt\ d\tau=\frac{1}{l^{4}}\sum X\delta U\ dt^{\prime}\ d\tau^{\prime}.

En remplaçant ΣXδU par sa valeur (3) et identifiant, il vient:

X^{\prime}=\frac{k}{l^{5}}X+\frac{k\epsilon}{l^{5}}\sum X\xi,\quad Y^{\prime}=\frac{1}{l^{5}}Y,\quad Z^{\prime}=\frac{1}{l^{5}}Z.

Ce sont les équations (11) du § 1. Le principe de moindre action nous conduit donc au même résultat que l'analyse du § 1.

Si nous nous reportons aux formules (1), nous voyons que Σf²-Σα² n'est pas altérée par la transformation de Lorentz, sauf un facteur constant; il n'en est pas de même de l'expression Σf²+Σα² qui figure dans l'énergie. Si nous nous bornons au cas où ε est assez petit pour qu'on en puisse négliger le carré de sorte que k=1 et si nous supposons aussi l=1, nous trouvons:

\sum f^{\prime2}=\sum f^{2}+2\epsilon\left(g\gamma-h\beta\right),

\sum\alpha^{\prime2}=\sum\alpha^{2}+2\epsilon\left(g\gamma-h\beta\right),


ou, par addition

\sum f^{\prime2}+\sum\alpha^{\prime2}=\sum f^{2}+\sum\alpha^{2}+4\epsilon\left(g\gamma-h\beta\right).


§ 4. — Le Groupe de Lorentz.


Il importe de remarquer que les transformations de Lorentz forment un groupe.

Si l'on pose en effet:

x^{\prime}=kl(x+\epsilon t),\quad y^{\prime}=ly,\quad z^{\prime}=lz,\quad t^{\prime}=kl(t+\epsilon x),

et d'autre part
x^{\prime\prime}=k^{\prime}l^{\prime}(x^{\prime}+\epsilon^{\prime}t^{\prime}),\quad y^{\prime\prime}=l^{\prime}y^{\prime},\quad z^{\prime\prime}=l^{\prime}z^{\prime},\quad t^{\prime\prime}=k^{\prime}l^{\prime}(t^{\prime}+\epsilon^{\prime}x^{\prime}),


avec

k^{-2}=1-\epsilon^{2},\quad k^{\prime-2}=1-\epsilon^{\prime2}


il viendra:

x^{\prime\prime}=k^{\prime\prime}l^{\prime\prime}(x+\epsilon^{\prime\prime}t),\quad y^{\prime\prime}=l^{\prime\prime}y,\quad z^{\prime\prime}=l^{\prime\prime}z,\quad t^{\prime\prime}=k^{\prime\prime}l^{\prime\prime}(t+\epsilon^{\prime\prime}x),


avec

\epsilon^{\prime\prime}=\frac{\epsilon+\epsilon^{\prime}}{1+\epsilon\epsilon^{\prime}},\quad l^{\prime\prime}=ll^{\prime},\quad k^{\prime\prime}=kk^{\prime}(1+\epsilon\epsilon^{\prime})=\frac{1}{\sqrt{1-\epsilon^{\prime\prime2}}}.

Si nous donnons à l la valeur 1, que nous supposions ε infiniment petit,

x^{\prime}=x+\delta x,\quad y^{\prime}=y+\delta y,\quad z^{\prime}=z+\delta z,\quad t^{\prime}=t+\delta t


il viendra:

\delta x=\epsilon t,\quad\delta y=\delta z=0,\quad\delta t=\epsilon x.

C'est là la transformation infinitésimale génératrice du groupe, que j'appellerai la transformation T1 et qui d'après la notation de Lie peut s'écrire:

t\frac{d\varphi}{dx}+x\frac{d\varphi}{dt}=T_{1}.

Si nous supposons ε=0 et l=1+δl, nous trouverions au contraire

\delta x=x\delta l,\quad\delta y=y\delta l,\quad\delta z=z\delta l,\quad\delta t=t\delta l


et nous aurions une autre transformation infinitésimale t0 du groupe (à supposer que l et ε soient regardés comme des variables indépendantes) et on aurait avec la notation de Lie:

T_{0}=x\frac{d\varphi}{dx}+y\frac{d\varphi}{dy}+z\frac{d\varphi}{dz}+t\frac{d\varphi}{dt}.

Maïs on pourrait faire jouer à l'axe des y ou à celui des z le rôle particulier que nous avons fait jouer à l'axe des x; on aurait ainsi deux autres transformations infinitésimales:

T_{2}=t\frac{d\varphi}{dy}+y\frac{d\varphi}{dt},

T_{3}=t\frac{d\varphi}{dz}+z\frac{d\varphi}{dt},


qui n'altéreraient pas non plus les équations de Lorentz.

On peut former les combinaisons imaginées par Lie, telles que

\left[T_{1},T_{2}\right]=x\frac{d\varphi}{dy}-y\frac{d\varphi}{dx},


mais il est aisé de voir que cette transformation équivaut à un changement d'axes de coordonnées, les axes tournant d'un angle très petit autour de l'axe des z. Nous ne devons donc pas nous étonner si un pareil changement n'altère pas la forme des équations de Lorentz, évidemment indépendantes du choix des axes.

Nous sommes donc amenés à envisager un groupe continu que nous appellerons le groupe de Lorentz et qui admettra comme transformations infinitésimales:

1° la transformation T0 qui sera permutable a toutes les autres;

2° les trois transformations T1, T2, T3;

3° les trois rotations [T1, T2], [T2, T3], [T3, T1].

Une transformation quelconque de ce groupe pourra toujours se décomposer en une transformation de la forme:

x^{\prime}=lx,\quad y^{\prime}=ly,\quad z^{\prime}=lz,\quad t^{\prime}=lt


et une transformation linéaire qui n'altère pas la forme quadratique

x^{2}+y^{2}+z^{2}-t^{2}\,

Nous pouvons encore engendrer notre groupe d'une autre manière. Toute transformation du groupe pourra être regardée comme une transformation de la forme:

(1) x^{\prime}=kl(x+\epsilon t),\quad y^{\prime}=ly,\quad z^{\prime}=lz,\quad t^{\prime}=kl(t+\epsilon x)


précédée et suivie d'une rotation convenable.

Mais pour notre objet, nous ne devons considérer qu'une partie des transformations de ce groupe; nous devons supposer que l est une fonction de ε, et il s'agît de choisir cette fonction, de façon que cette partie du groupe, que j'appellerai P forme encore un groupe.

Faisons tourner le système de 180° autour de l'axe des y, nous devrons retrouver une transformation qui devra encore appartenir à P. Or cela revient à changer le signe de x, x', z et z'; on trouve ainsi:

(2) x^{\prime}=kl(x-\epsilon t),\quad y^{\prime}=ly,\quad z^{\prime}=lz,\quad t^{\prime}=kl(t-\epsilon x)

Donc l ne change pas quand on change ε en -ε.

D'autre part, si P est un groupe, la substitution inverse de (1), qui s'écrit:

(3) x^{\prime}=\frac{k}{l}(x-\epsilon t),\quad y^{\prime}=\frac{y}{l},\quad z^{\prime}=\frac{z}{l},\quad t^{\prime}=\frac{k}{l}(t-\epsilon x),


devra également appartenir à P; elle devra donc être identique à (2}, c'est-à-dire que

l=\frac{1}{l}.

On devra donc avoir l=1.


§ 5. — Ondes de Langevin.

M. Langevin a mis sous une forme particulièrement élégante les formules qui définissent le champ électromagnétique produit par le mouvement d'un électron unique.

Reprenons les équations

(1) \square\psi=-\rho,\quad\square F=-\rho\xi.

On sait qu'on peut les intégrer par les potentiels retardés et qu'on a:

(2) \psi=\frac{1}{4\pi}\int\frac{\rho_{1}d\tau}{r},\quad F=\frac{1}{4\pi}\int\frac{\rho_{1}\xi_{1}d\tau_{1}}{r}.

Dans ces formules on a:

d\tau_{1}=dx_{1}dy_{1}dz_{1},\quad r^{2}=(x-x_{1})^{2}+(y-y_{1})^{2}+(z-z_{1})^{2},


tandis que ρ1, et ξ1, sont les valeurs de ρ et de ξ au point x1, y1, z1, et à l'instant

t_{1}=t-r\,

Soient: x0, y0, z0 les coordonnées d'une molécule d'électron à l'instant t;


ses coordonnées à l'instant t;

x_{1}=x_{0}+U,\ y_{1}=y_{0}+V,\ z_{1}=z_{0}+W


U, V, W sont des fonctions de x0, y0, z0, de sorte que nous pourrons écrire:

dx_{1}=dx_{0}+\frac{dU}{dx_{0}}dx_{0}+\frac{dU}{dy_{0}}dy_{0}+\frac{dU}{dz_{0}}dz_{0}+\xi_{1}dt_{1};


et si l'on suppose t constant, ainsi que x, y et z:

dt_{1}=+\sum\frac{x-x_{1}}{r}dx_{1}.

Nous pouvons donc écrire:

dx_{1}\left(1+\xi_{1}\frac{x_{1}-x}{r}\right)+dy_{1}\xi_{1}\frac{y_{1}-y}{r}+dz_{1}\xi_{1}\frac{z_{1}-z}{r}=dx_{0}\left(1+\frac{dU}{dx_{0}}\right)+dy_{0}\frac{dU}{dy_{0}}+dz_{0}\frac{dU}{dz_{0}}


avec les deux autres équations qu'on peut en déduire par permutation circulaire.

Nous avons donc:

(3) d\tau_{1}\mid1+\xi_{1}\frac{x_{1}-x}{r},\quad\xi_{1}\frac{y_{1}-y}{r},\quad\xi_{1}\frac{z_{1}-z}{r}\mid=d\tau_{0}\mid1+\frac{dU}{dx_{0}},\quad\frac{dU}{dy_{0}},\quad\frac{dU}{dz_{0}}\mid,


en posant

d\tau_{0}=dx_{0}dy_{0}dz_{0}\,

Étudions les déterminants qui figurent dans les deux membres de (3) et d'abord dans le 1er membre; si on cherche à le développer, on voit que les termes du 2d et du 3e degré par rapport à ξ1, η1, ζ1 disparaissent et que le déterminant est égal à

1+\xi_{1}\frac{x_{1}-x}{r}+\eta_{1}\frac{y_{1}-y}{r}+\zeta_{1}\frac{z_{1}-z}{r}=1+\omega,


ω désignant la composante radiale de la vitesse ξ1, η1, ζ1, c'est-à-dire la composante dirigée suivant le rayon vecteur qui va dit point x, y, t au point x1, y1, z1.

Pour obtenir le 2d déterminant, j'envisage les coordonnées des différentes molécules de l'électron à un instant t', qui est le même pour toutes les molécules, mais de telle façon que pour la molécule que j'envisage on ait t1=t'1. Les coordonnées d'une molécule seront alors:

x'_{1}=x_{0}+U',\ y'_{1}=y_{0}+V',\ z'_{1}=z_{0}+W'

U', V, W étant ce que deviennent U, V, W quand on y remplace t1 par t'1; comme t'1 est le même pour toutes les molécules, on aura:
dx_{1}^{\prime}=dx_{0}\left(1+\frac{dU^{\prime}}{dx_{0}}\right)+dy_{0}\frac{dU^{\prime}}{dy_{0}}+dz_{0}\frac{dU^{\prime}}{dz_{0}}


et par conséquent

d\tau_{1}^{\prime}=d\tau_{0}\mid1+\frac{dU^{\prime}}{dx_{0}},\quad\frac{dU^{\prime}}{dy_{0}},\quad\frac{dU^{\prime}}{dz_{0}}\mid


en posant

d\tau_{1}^{\prime}=dx_{1}^{\prime}dy_{1}^{\prime}dz_{1}^{\prime}.

Mais l'élément de charge électrique est

d\mu_{1}=\rho_{1}d\tau_{1}^{\prime}


et de plus pour la molécule envisagée, on a t1=t'1, et par conséquent \frac{dU^{\prime}}{dx_{0}}=\frac{dU}{dx_{0}} etc.; nous pouvons donc écrire:

d\mu_{1}=\rho_{1}d\tau_{0}\mid1+\frac{dU}{dx_{0}},\quad\frac{dU}{dy_{0}},\quad\frac{dU}{dz_{0}}\mid


de sorte que l'équation (3) deviendra:

\rho_{1}d\tau_{1}(1+\omega)=d\mu_{1}\,


et les équations (2):

\psi=\frac{1}{4\pi}\int\frac{d\mu_{1}}{r(1+\omega)},\quad F=\frac{1}{4\pi}\int\frac{\xi_{1}d\mu_{1}}{r(1+\omega)}.

Si nous avons affaire à un électron unique, nos intégrales se réduiront à un seul élément, pourvu que l'on ne considère que des points x, y, x suffisamment éloignés pour que r et ω aient sensiblement la même valeur pour tous les points de l'électron. Les potentiels ψ, F, G, H dépendront de la position de cet électron, et aussi de sa vitesse, car non seulement ξ1, η1, ζ1 figurent au numérateur dans F, G, H, mais la composante radiale ω figure au dénominateur. Il s'agit bien entendu de sa position et de sa vitesse à l'instant t1.

Les dérivées partielles de φ, F, G, H par rapport à t, x, y, z (et par conséquent les champs électrique et magnétique) dépendront en outre de son accélération. De plus, elles en dépendront linéairement, puisque dans ces dérivées cette accélération s'introduit par suite d'une différentiation unique.

Langevin a été ainsi conduit à distinguer dans les champs électrique et magnétique les termes qui ne dépendent pas de l'accélération (c'est ce qu'il appelle l'onde de vitesse) et ceux qui sont proportionnels à l'accélération (c'est ce qu'il appelle l'onde d'accélération).

Le calcul de ces deux ondes est facilité par la transformation de Lorentz. Nous pouvons en effet appliquer cette transformation au système, de façon que la vitesse de l'électron unique envisagé devienne nulle. Nous prendrons pour l'axe des x la direction de cette vitesse avant la transformation, de sorte que, à l'instant t1,

\eta_{1}=\zeta_{1}=0\,

et nous prendrons ε=-ξ de telle façon que

\xi'_{1}=\eta'_{1}=\zeta'_{1}=0\,

Nous pouvons donc ramener le calcul des deux ondes au cas où la vitesse de l'électron est nulle. Commençons par l'onde de vitesse; nous pouvons remarquer d'abord que cette onde est la même que si le mouvement de l'électron était uniforme.

Si la vitesse de l'électron est nulle, on a:

\omega=0,\quad F=G=H=0,\quad\psi=\frac{\mu_{1}}{4\pi r},


μ1 étant la charge électrique de l'électron. La vitesse ayant été ramenée à zéro par la transformation de Lorentz, nous avons donc:

F^{\prime}=G^{\prime}=H^{\prime}=0,\quad\psi^{\prime}=\frac{\mu_{1}}{4\pi r^{\prime}},


r' étant la distance du point x', y', z' au Point x'1, y'1, z'1, et par conséquent:

\alpha^{\prime}=\beta^{\prime}=\gamma^{\prime}=0,

f^{\prime}=\frac{\mu_{1}\left(x^{\prime}-x_{1}^{\prime}\right)}{4\pi r^{\prime3}}\quad g^{\prime}=\frac{\mu_{1}\left(y^{\prime}-y_{1}^{\prime}\right)}{4\pi r^{\prime3}},\quad h^{\prime}=\frac{\mu_{1}\left(z^{\prime}-z_{1}^{\prime}\right)}{4\pi r^{\prime3}}.

Faisons maintenant la transformation inverse de celle de Lorentz pour trouver le champ véritable correspondant à une vitesse — s, 0, 0. Nous trouvons, en nous reportant aux équations (9) et (3) du § 1:

(4) \begin{cases} & \alpha=0,\quad\beta=\epsilon h,\quad\gamma=-\epsilon g,\\ \\ & f=\frac{\mu_{1}kl^{3}}{4\pi r^{\prime3}}\left(x+\epsilon t-x_{1}-\epsilon t_{1}\right),\quad g=\frac{\mu_{1}kl^{3}}{4\pi r^{\prime3}}\left(y-y_{1}\right),\quad h=\frac{\mu_{1}kl^{3}}{4\pi r^{\prime3}}\left(z-z_{1}\right).\end{cases}

On voit que le champ magnétique est perpendiculaire à l'axe des x (direction de la vitesse) et au champ électrique, et que le champ électrique est dirigé vers le point:

(5) x_{1}+\epsilon(t_{1}-t),\ y_{1},\ z_{1}.

Si l'électron continuait à se mouvoir d'un mouvement rectiligne et uniforme avec la vitesse qu'il avait à l'instant t1, c'est-à-dire avec la vitesse -ε, 0, 0, ce point (5) serait celui qu'il occuperait à l'instant t.

Passons à l'onde d'accélération; nous pouvons, grâce à la transformation de Lorentz, ramener sa détermination au cas où la vitesse est nulle. C'est le cas qui est réalisé si on imagine un électron qui exécute des oscillations d'amplitude très petites, mais très rapides, de façon que les déplacements et les vitesses soient infiniment petits, mais que les accélérations soient finies. On retombe ainsi sur le champ qui a été étudié dans le célèbre Mémoire de Hertz intitulé Die Kräfte elektrischer Schwingungen nach der Maxwell'schen Theorie et cela pour un point très éloigné. Dans ces conditions:

I° Les deux champs électrique et magnétique sont égaux entre eux.

2° Us sont perpendiculaires entre eux.

3° Ils sont perpendiculaires à la normale à la sphère d'onde, c'est-à-dire à la sphère dont le centre est le point x1, y1, z1.

Je dis que ces trois propriétés subsisteront encore quand la vitesse ne sera pas nulle, et pour cela, il me suffit de montrer qu'elles ne sont pas altérées par la transformation de Lorentz.

Soit en effet A l'intensité commune des deux champs, soit

(x-x_{1})=r\lambda,\quad(y-y_{1})=r\mu,\quad(z-z_{1})=r\nu,\quad\lambda^{2}+\mu^{2}+\nu^{2}=1.

Ces propriétés s'exprimeront par les égalités:

\begin{cases} & A^{2}=\sum f^{2}=\sum\alpha^{2},\quad\sum f\alpha=0,\quad\sum f\left(x-x_{1}\right)=0,\quad\sum\alpha\left(x-x_{1}\right)=0\\ \\ & \sum f\lambda=0,\quad\sum\alpha\lambda=0;\end{cases}


ce qui veut dire encore que

\begin{array}{ccccc} \frac{b}{A}, & & \frac{g}{A}, & & \frac{h}{A}\\ \\\frac{\alpha}{A}, & & \frac{\beta}{A}, & & \frac{\gamma}{A}\\ \\\lambda, & & \mu, & & \nu\end{array}


sont les cosinus directeurs de trois directions rectangulaires, et on en déduit les relations:

f=\beta\nu-\gamma\mu,\quad\alpha=h\mu-g\nu,


ou

(6) fr=\beta\left(z-z_{1}\right)-\gamma\left(y-y_{1}\right)\quad\alpha r=h\left(y-y_{1}\right)-g\left(z-z_{1}\right),


avec les équations que l'on en peut déduire par symétrie.

Si nous reprenons les équations (3) du § 1, nous trouvons:

(7) \begin{cases} x^{\prime}-x_{1}^{\prime}=kl\left[\left(x-x_{1}\right)+\epsilon\left(t-t_{1}\right)\right]=kl\left[\left(x-x_{1}\right)+\epsilon r\right],\\ \\y^{\prime}-y_{1}^{\prime}=l\left(y-y_{1}\right),\\ \\z^{\prime}-z_{1}^{\prime}=l\left(z-z_{1}\right).\end{cases}

Nous avons trouvé plus haut au § 3:

l^{4}\left(\sum f^{\prime2}-\sum\alpha^{\prime2}\right)=\sum f^{2}-\sum\alpha^{2}.

Donc \sum f^{2}=\sum\alpha^{2} à entraine \sum f^{\prime2}-\sum\alpha^{\prime2}.

D'autre part, en partant des équations (9) du § 1, on trouve:

l^{4}\sum f^{\prime}\alpha^{\prime}=\sum f\alpha,


ce qui montre que \sum f\alpha=0 entraine \sum f^{\prime}\alpha^{\prime}=0.

Je dis maintenant que

(8) \sum f^{\prime}\left(x^{\prime}-x_{1}^{\prime}\right)=0,\quad\sum\alpha^{\prime}\left(x^{\prime}-x_{1}^{\prime}\right)=0.

En effet, en vertu des équations (7) (ainsi que des équations 9 du § 1) fa premiers membres des deux équations (8) s'écrivent respectivement:

\frac{k}{l}\sum f\left(x-x_{1}\right)+\frac{k\epsilon}{l}\left[fr+\gamma\left(y-y_{1}\right)-\beta\left(z-z_{1}\right)\right],

\frac{k}{l}\sum\alpha\left(x-x_{1}\right)+\frac{k\epsilon}{l}\left[\alpha r-h\left(y-y_{1}\right)-g\left(z-z_{1}\right)\right].

Ils s'annulent donc en vertu des équations \sum f\left(x-x_{1}\right)=\sum\alpha\left(x-x_{1}\right)=0 et en vertu des équations (6). Or c'est là précisément ce qu'il s'agissait de démontrer.

On peut d'ailleurs arriver au même résultat par de simples considérations d'homogénéité.

En effet, ψ, F, G, H sont des fonctions de x-x_{1},\ y-y_{1},\ z-z_{1},\ \xi_{1}=\frac{dx_{1}}{dt_{1}},\ \eta_{1}=\frac{dy_{1}}{dt_{1}},\ \zeta_{1}=\frac{dz_{1}}{dt_{1}} homogènes de degré -1 par rapport à x, y, z, t, x1, y1, z1, t1 et à leurs différentielles.

Donc les dérivées de ψ, F, G, H par rapport à x, y, z, t (et par conséquent aussi les deux champs f, g, h; α, β, γ) seront homogènes de degré -2 par rapport aux mêmes quantités, si nous nous rappelons d'ailleurs que la relation

t-t_{1}=r=\sqrt{\sum\left(x-x_{1}\right)^{2}}


est homogène par rapport à ces quantités.

Or ces dérivées ou ces champs dépendent des x-x1, des vitesses \frac{dx_{1}}{dt_{1}}, et des accélérations \frac{d^{2}x_{1}}{dt_{1}^{2}}; ils se composent d'un terme indépendant des accélérations (onde de vitesse) et d'un terme linéaire par rapport aux accélérations (onde d'accélération). Or \frac{dx_{1}}{dt_{1}} est homogène de degré 0 et \frac{d^{2}x_{1}}{dt_{1}^{2}} homogène de degré -1; d'où il suit que l'onde de vitesse est homogène de degré -2 par rapport à x-x1, y-y1, z-z1, et l'onde d'accélération homogène de degré — 1. Donc, en un point très éloigné l'onde d'accélération est prépondérante et peut par conséquent être regardée comme se confondant avec l'onde totale. De plus, la loi d'homogénéité nous montre que l'onde d'accélération est semblable à elle-même en un point éloigné et en un point quelconque. Elle est donc, en un point quelconque, semblable à l'onde totale en un point éloigné. Or en un point éloigné la perturbation ne peut se propager que par ondes planes, de sorte que les deux champs doivent être égaux, perpendiculaires entre eux et perpendiculaires à la direction de propagation.

Je me bornerai à renvoyer pour plus de détails au Mémoire de M. Langevin dans le Journal de Physique (Année 1905).


§ 6. — Contraction des Électrons.

Supposons un électron unique animé d'un mouvement de translation rectiligne et uniforme. D'après ce que nous venons de voir, on peut, grâce à la transformation de Lorentz, ramener l'étude du champ déterminé par cet électron au cas où l'électron serait immobile; la transformation de Lorentz remplace donc l'électron réel en mouvement par un électron idéal immobile.

Soit α, β, γ; f, g, h le champ réel; soit α', β', γ'; f', g', h' ce que devient le champ après la transformation de Lorentz, de sorte que le champ idéal α', f' correspond au cas d'un électron immobile; on a:

\alpha^{\prime}=\beta^{\prime}=\gamma^{\prime}=0,\quad f^{\prime}=-\frac{d\psi^{\prime}}{dx^{\prime}},\quad g^{\prime}=-\frac{d\psi^{\prime}}{dy^{\prime}},\quad h^{\prime}=-\frac{d\psi^{\prime}}{dz^{\prime}};


et pour le champ réel (en vertu des formules 9 du § 1):

(1) \begin{cases}
\alpha=0,\quad\beta=\epsilon h,\quad\gamma=-\epsilon g\\
\\
f=l^{2}f^{\prime},\quad g=kl^{2}g^{\prime},\ h=kl^{2}h^{\prime}.
\end{cases}

Il s'agit maintenant de déterminer l'énergie totale due au mouvement de l'électron, l'action correspondante et la quantité de mouvement électromagnétique, afin de pouvoir calculer les masses électromagnétiques de l'électron. Pour un point éloigné, il suffit de considérer l'électron comme réduit á un point unique; on est ainsi ramené aux formules (4) du § précédent qui généralement peuvent convenir. Mais ici elles ne sauraient suffire, parce que l'énergie est principalement localisée dans les parties de l'éther les plus voisines de l'électron.

On peut faire à ce sujet plusieurs hypothèses.

D'après celle d'Abraham, les électrons seraient sphériques et indéformables.

Alors, quand on appliquerait la transformation de Lorentz, comme l'électron réel serait sphérique, l'électron idéal deviendrait un ellipsoïde. L'équation de cet ellipsoïde serait d'après le § 1:

k^{2}\left(x^{\prime}-\epsilon t^{\prime}-\xi t^{\prime}+\epsilon\xi x^{\prime}\right)^{2}+\left(y^{\prime}-\eta kt^{\prime}+\eta k\epsilon x^{\prime}\right)^{2}

+\left(z^{\prime}-\zeta kt^{\prime}+\zeta k\epsilon x^{\prime}\right)^{2}=l^{2}r^{2}

Mais ici l'on a:

\xi+\epsilon=\eta=\zeta=0,\quad1+\epsilon\xi=1-\epsilon^{2}=\frac{1}{k^{2}},


de sorte que l'équation de l'ellipsoïde devient:

\frac{x^{\prime2}}{k^{2}}+y^{\prime2}+z^{\prime2}=l^{2}r^{2}.

Si le rayon de l'électron réel est r, les axes de l'électron idéal seraient donc:

klr,\ lr,\ lr.

Dans l'hypothèse de Lorentz, au contraire, les électrons en mouvement seraient déformés, de telle façon que ce serait l'électron réel qui deviendrait un ellipsoïde, tandis que l'électron idéal immobile serait toujours une sphère de rayon r; les axes de l'électron réel seront alors:

\frac{r}{lk},\quad\frac{r}{l},\quad\frac{r}{l}.

Désignons par

A=\frac{1}{2}\int f^{2}d\tau


l'énergie électrique longitudinale; par

B=\frac{1}{2}\int\left(g^{2}+h^{2}\right)d\tau

l'énergie électrique transversale; par
C=\frac{1}{2}\int\left(\beta^{2}+\gamma^{2}\right)d\tau


l'énergie magnétique transversale. Il n'y a pas d'énergie magnétique longitudinale, puisque α=α'=0. Désignons par A', B', C' les quantités correspondantes dans le système idéal. On trouve d'abord:

C'=0,\ C=\epsilon^{2}B

D'autre part, nous pouvons observer que le champ réel dépend seulement de x=εt, y, et x, et écrire:

d\tau=d(x+\epsilon t)dy\ dz
d\tau'=dy'dy'dz'=kl^{3}d\tau\,


d'où

A^{\prime}=kl^{-1}A,\quad B^{\prime}=k^{-1}l^{-1}B,\quad A=\frac{lA^{\prime}}{k},\quad B=klB^{\prime}.

Dans l'hypothèse de Lorentz on a B' = 2 A', et A', inversement proportionnel au rayon de l'électron, est une constante indépendante de la vitesse de l'électron réel; on trouve ainsi pour l'énergie totale:

A+B+C=A'lk\left(3+\epsilon^{2}\right)


et pour l'action (par unité de temps):

A+B-C=\frac{3A^{\prime}l}{k}.

Calculons maintenant la quantité de mouvement électromagnétique; nous trouverons:

D=\int\left(g\gamma-h\beta\right)d\tau=-\epsilon\int\left(g^{2}+h^{2}\right)d\tau=-2\epsilon B=-4\epsilon klA^{\prime}.

Mais on doit avoir certaines relations entre l'énergie E = A + B + C, l'action par unité de temps H = A + B - C, et la quantité de mouvement D. La première de ces relations est:

E=H-\epsilon\frac{dH}{d\epsilon},


la seconde est

\frac{dD}{d\epsilon}=-\frac{1}{\epsilon}\frac{dE}{d\epsilon};


d'où

(2) D=\frac{dH}{d\epsilon},\quad E=H-\epsilon D.

La seconde des équations (2) est toujours satisfaite; mais la première ne l'est que si

l=\left(1-\epsilon^{2}\right)^{\frac{1}{6}}=k^{-\frac{1}{3}},


c'est-à-dire si le volume de l'électron idéal est égal à celui de l'électron réel, ou encore si le volume de l'électron est constant; c'est l'hypothèse de Langevin.

Cela est en contradiction avec le résultat du § 4 et avec le résultat obtenu par Lorentz par une autre voie. C'est cette contradiction qu'il s'agit d'expliquer.

Avant d'aborder cette explication, j'observe que, quelle que soit l'hypothèse adoptée nous aurons

H=A+B-C=\frac{l}{k}(A^{\prime}+B^{\prime}),


ou, à cause de C' = 0,

(3) H=\frac{l}{k}H^{\prime},

Nous pouvons rapprocher ce résultat de l'équation J=J' obtenue au § 3.

Nous avons en effet:

J=\int H\ dt,\quad J^{\prime}=\int H^{\prime}\ dt^{\prime}.

Nous observerons que l'état du système dépend seulement de x+εt et z, c'est-à-dire de x', y', z', et que nous avons:

t^{\prime}=\frac{l}{k}t+\epsilon x^{\prime}
(4) dt^{\prime}=\frac{l}{k}dt.

En rapprochant les équations (3) et (4) on trouve J = J'.

Plaçons-nous dans une hypothèse quelconque, qui pourra être, soit celle de Lorentz soit celle d'Abraham, soit celle de Langevin, soit une hypothèse intermédiaire.

Soient

r,\ \theta r,\ \theta r


les trois axes de l'électron réel; ceux de l'électron idéal seront:

klr,\ \theta lr,\ \theta lr

Alors A' + B' sera l'énergie électrostatique due à un ellipsoïde ayant pour axes klr, θlr, θlr.

Que l'on suppose l'électricité répandue à la surface de l'électron connue à celle d'un conducteur, ou uniformément répandue à l'intérieur de cet électron; cette énergie sera de la forme:

A^{\prime}+B^{\prime}=\frac{\varphi\left(\frac{\theta}{k}\right)}{klr},


où φ est une fonction connue.

L'hypothèse d'Abraham consiste à supposer:

r = const.,\ \theta = 1.

Celle de Lorentz:

l = 1,\ kr = const.,\ \theta = k.

Celle de Langevin:

l=k^{-\frac{1}{3}},\quad k=\theta,\quad klr=const..

On trouve ensuite:

H=\frac{\varphi\left(\frac{\theta}{k}\right)}{k^{2}r}.

Abraham trouve, à la différence des notations près (Göttinger Nachrichten, 1902, p. 37)

H=\frac{a}{r}\frac{1-\epsilon^{2}}{\epsilon}\log\frac{1+\epsilon}{1-\epsilon},


a étant une constante. Or, dans l'hypothèse d'Abraham, on a θ=1; donc:

(5) \varphi\left(\frac{1}{k}\right)=ak^{2}\frac{1-\epsilon^{2}}{\epsilon}\log\frac{1+\epsilon}{1-\epsilon}=\frac{a}{\epsilon}\log\frac{1+\epsilon}{1-\epsilon},


ce qui définit la fonction φ.

Cela posé, imaginons que l'électron soit soumis à une liaison, de telle façon qu'il y ait une relation entre r et φ; dans l'hypothèse de Lorentz cette relation serait φr = const., dans celle de Langevin φ²r² = const. Nous supposerons d'une façon plus générale

r=b\theta^{m}\,


b étant une constante; d'où:

H=\frac{1}{bk^{2}}\theta^{-m}\varphi\left(\frac{\theta}{k}\right).

Quelle sera la forme que prendra l'électron quand la vitesse deviendra -εt, si l'on ne suppose pas l'intervention d'autres forces que celles de liaison? Cette forme sera définie par l'égalité:

(6) \frac{\partial H}{\partial\theta}=0,


ou

-m\theta^{-m-1}\varphi+\theta^{-m}k^{-1}\varphi^{\prime}=0


ou

\frac{\varphi^{\prime}}{\varphi}=\frac{mk}{\theta}.

Si nous voulons que l'équilibre ait lieu de telle façon que θ=k, il faut que pour \frac{\theta}{k}=1, la dérivée logarithmique de φ soit égale à m.

Si nous développons \frac{1}{k} et le 2d membre de (5) suivant les puissances de ε, l'équation (5) devient:

\varphi\left(1-\frac{\epsilon^{2}}{2}\right)=a\left(1-\frac{\epsilon^{2}}{3}\right)


en négligeant les puissances supérieures de ε.

En différentiant, il vient:

-\epsilon\varphi^{\prime}\left(1-\frac{\epsilon^{2}}{2}\right)=\frac{2}{3}\epsilon a.

Pour ε=0, c'est-à-dire quand l'argument de φ est égal à 1, ces équations deviennent:

(7) \varphi=a,\quad\varphi^{\prime}=-\frac{2}{3}a,\quad\frac{\varphi^{\prime}}{\varphi}=-\frac{2}{3}.

On doit donc avoir m=-\frac{2}{3} conformément à l'hypothèse de Langevin.

Ce résultat doit être rapproché de celui qui est relatif à la 1ere équation (a) et dont en réalité il ne diffère pas. En effet, supposons que tout élément dτ de l'électron soit soumis à une force Xdτ parallèle à l'axe des x, X étant le même pour tous les éléments; nous aurons alors, conformément à la définition de la quantité de mouvement:

\frac{dD}{dt}=\int Xd\tau.

D'autre part, le principe de moindre action nous donne:

\delta J=\int X\delta U\ d\tau\ dt,\quad J=\int H\ dt,\quad\delta J=\int D\delta U\ dt,


δU étant le déplacement du centre de gravité de l'électron; H dépend de θ et de ε si l'on admet que r est lié à θ par l'équation de liaison; on a alors:

\delta J=\int\left(\frac{\partial H}{\partial\epsilon}\delta\epsilon+\frac{\partial H}{\partial\theta}\right)dt.

D'autre part \delta\epsilon=-\frac{d\delta U}{dt}; d'où, en intégrant par parties:

\int D\delta\epsilon\ dt=\int D\delta U\ dt


ou

\int\left(\frac{\partial H}{\partial\epsilon}\delta\epsilon+\frac{\partial H}{\partial\theta}\delta\theta\right)dt=\int D\delta\epsilon\ dt,


d'où

D=\frac{\partial H}{\partial\epsilon},\quad\frac{\partial H}{\partial\theta}=0.

Mais la dérivée \frac{dH}{d\epsilon}, qui figure dans le 2d membre de la 1ere équation (2), c'est la dérivée prise en supposant θ exprimé en fonction de ε, de sorte que

\frac{dH}{d\epsilon}=\frac{\partial H}{\partial\epsilon}+\frac{\partial H}{\partial\theta}\frac{d\theta}{d\epsilon}.

L'équation (2) équivaut donc à l'équation (6).

La conclusion est que si l'électron est soumis à une liaison entre ses trois axes, et si aucune autre force n'intervient en dehors des forces de liaison, la forme que prendra cet électron, quand il sera animé d'une vitesse uniforme, ne pourra être telle que l'électron idéal correspondant soit une sphère, que dans le cas où la liaison sera que le volume soit constant, conformément à l'hypothèse de Langevin.

Nous sommes amenés de la sorte à nous poser le problème suivant: quelles forces supplémentaires, autres que les forces de liaison, serait-il nécessaire de faire intervenir pour rendre compte de la loi de Lorentz ou, plus généralement, de toute loi autre que celle de Langevin?

L'hypothèse la plus simple, et la première que nous devions examiner, c'est que ces forces supplémentaires dérivent d'un potentiel spécial dérivant des trois axes de l'ellipsoïde, et par conséquent de θ et de r; soit F(θ, r) ce potentiel; dans ce cas l'action aura pour expression:

J=\int\left[H+F(\theta,r)\right]dt


et les conditions d'équilibre s'écriront:

(8) \frac{dH}{d\theta}+\frac{dF}{d\theta}=0,\quad\frac{dH}{dr}+\frac{dF}{dr}=0.

Si nous supposons r et θ liés par la liaison r = bθm, nous pourrons regarder r comme fonction de θ, envisager F comme ne dépendant que de θ et conserver seulement la 1ere équation (8) avec:

H=\frac{\varphi}{bk^{2}\theta^{m}},\quad\frac{dH}{d\theta}=\frac{-m\theta}{bk^{2}\theta^{m+1}}+\frac{\varphi^{\prime}}{bk^{3}\theta^{m}}

Il faut que, pour k =θ l'équation (8) soit satisfaite; ce qui donne, en tenant compte des équations (7):

\frac{dF}{d\theta}=\frac{ma}{b\theta^{m+3}}+\frac{2}{3}\frac{a}{b\theta^{m+3}}


d'où:

F=\frac{-a}{b\theta^{m+2}}\frac{m+\frac{2}{3}}{m+2}


et dans l'hypothèse de Lorentz, où m=-1:

F=\frac{a}{3b\theta}.

Supposons maintenant qu'il n'y ait aucune liaison et, considérant r et θ comme deux variables indépendantes, conservons les deux équations (H); il viendra:

H=\frac{\varphi}{k^{2}r},\quad\frac{dH}{d\theta}=\frac{\varphi^{\prime}}{k^{3}r},\quad\frac{dH}{dr}=\frac{-\varphi}{k^{2}r^{2}},

Les équations (8) doivent être satisfaites pour k = θ, r = vθm; ce qui donne:

(9) \frac{dF}{dr}=\frac{a}{b^{2}\theta^{2m+2}},\quad\frac{dF}{d\theta}=\frac{2}{3}\frac{a}{b\theta^{m+3}}.

Une des manières de satisfaire à ces conditions est de poser:

(10) F=Ar^{\alpha}\theta^{\beta}\,

A, α, β étant des constantes; les équations (9) doivent être satisfaites pour k = θ, r = vθm, ce qui donne:

A\alpha b^{\alpha-1}\theta^{m\alpha-m+\beta}=\frac{a}{b^{2}\theta^{2m+2}},\quad A\beta b^{\alpha}\theta^{m\alpha+\beta-1}=\frac{2}{3}\frac{a}{b\theta^{m+3}}.

En identifiant on trouve

(11) \alpha=3\gamma,\quad\beta=2\gamma,\quad\gamma=-\frac{m+2}{3m+2},\quad A=\frac{a}{\alpha b^{\alpha+1}}

Mais le volume de l'ellipsoïde est proportionnel à r³, θ³, de sorte que le potentiel supplémentaire est proportionnel à la puissance γ du volume de l'électron.

Dans l'hypothèse de Lorentz, on a m=1, γ=1.

On retrouve donc l'hypothèse de Lorentz à la condition d'ajouter un potentiel supplémentaire proportionnel au volume de l'électron.

L'hypothèse de Langevin correspond á γ=∞.


§ 7. — Mouvement quasi-stationnaire.

Il reste à voir si cette hypothèse sur la contraction des électrons rend compte de l'impossibilité de mettre en évidence le mouvement absolu, et je commencerai par étudier le mouvement quasi-stationnaire d'un électron isolé, ou soumis seulement à l'action d'autres électrons éloignés.

On sait qu'on appelle mouvement quasi-stationnaire un mouvement où les variations de la vitesse sont assez lentes pour que les énergies magnétique et électrique dues au mouvement de l'électron différent peu de ce qu'elles seraient dans le mouvement uniforme; on sait également que c'est en partant de cette notion du mouvement quasi-stationnaire qu'Abraham est arrivé à celle des masses électromagnétiques transversale et longitudinale.

Je crois devoir préciser. Soit H notre action par unité de temps:

H=\frac{1}{2}\int\left(\sum f^{2}-\sum\alpha^{2}\right)d\tau,


où nous ne considérons pour le montent que les champs électrique et magnetique dus au mouvement d'un électron isolé. Au § précédent, considérant le mouvement comme uniforme, nous regardions H comme dépendant de la vitesse ξ, η, ζ du centre de gravité de l'électron (ces trois composantes, dans le § précédent, avaient pour valeurs -ε 0, 0) et des paramètres r et θ qui définissent la forme de l'électron.

Mais si le mouvement n'est plus uniforme, H dépendra non seulement des valeurs de ξ, η, ζ, r, θ a l'instant considéré, mais des valeurs de ces mêmes quantités à d'autres instants qui pourront en différer de quantités de même ordre que le temps mis par la lumière pour aller d'un point à l'autre de l'électron; en d'autres termes, H dépendra non seulement de ξ, η, ζ, r, θ, mais de leurs dérivées de tous les ordres par rapport au temps.

Eh bien, le mouvement sera dit quasi-stationnaire quand les dérivées partielles de H par rapport aux dérivées successives de ξ, η, ζ, r, θ seront négligeables devant les dérivées partielles de H par rapport aux quantités ξ, η, ζ, r, θ elles-mêmes.

Les équations d'un pareil mouvement pourront s'écrire:

(1) \begin{cases} & \frac{dH}{d\theta}+\frac{dF}{d\theta}=\frac{dH}{dr}+\frac{dF}{dr}=0,\\ \\ & \frac{d}{dt}\frac{dH}{d\xi}=-\int Xd\tau,\quad\frac{d}{dt}\frac{dH}{d\eta}=-\int Yd\tau,\quad\frac{d}{dt}\frac{dH}{d\zeta}=-\int Zd\tau.\end{cases}

Dans ces équations, F a la même signification que dans le § précédent; X, Y, Z sont les composantes de la force qui agit sur l'électron: cette force étant due uniquement aux champs électrique et magnétique produits par les autres électrons.

Observons que H ne dépend de ξ η ζ que par l'intermédiaire de la combinaison

V=\sqrt{\xi^{2}+\eta^{2}+\zeta^{2}},\,


c'est-à-dire de la grandeur de la vitesse; on a donc, en appelant encore D la quantité de mouvement:

\frac{dH}{d\xi}=\frac{dH}{dV}\frac{\xi}{V}=-D\frac{\xi}{V},


d'où:

(2) -\frac{d}{dt}\frac{dH}{d\xi}=\frac{D}{V}\frac{d\xi}{dt}-D\frac{\xi}{V^{2}}\frac{dV}{dt}+\frac{dD}{dV}\frac{\xi}{V}\frac{dV}{dt},
(2bis) -\frac{d}{dt}\frac{dH}{d\eta}=\frac{D}{V}\frac{d\eta}{dt}-D\frac{\eta}{V^{2}}\frac{dV}{dt}+\frac{dD}{dV}\frac{\eta}{V}\frac{dV}{dt},


avec

(3) V\frac{DV}{dt}=\sum\xi\frac{d\xi}{dt}.

Si nous prenons la direction actuelle de la vitesse pour axe des x, il vient:

\xi=V,\quad\eta=\zeta=0,\quad\frac{d\xi}{dt}=\frac{dV}{dt};


les équations (2) et (2l>ii) deviennent:

-\frac{d}{dt}\frac{dH}{d\xi}-\frac{dD}{dV}\frac{d\xi}{dt},\quad-\frac{d}{dt}\frac{dH}{d\eta}=\frac{D}{V}\frac{d\eta}{dt}


et les trois dernières équations (1):

(4) \frac{dD}{dV}\frac{d\xi}{dt}=\int Xd\tau,\quad\frac{D}{V}\frac{d\eta}{dt}=\int Yd\tau,\quad\frac{D}{V}\frac{d\zeta}{dt}=\int Zd\tau.

C'est pourquoi Abraham a donné à \frac{dD}{dV} le nom de masse longitudinale et \frac{D}{V} le nom de masse transversale; rappelons que D=\frac{dH}{dV}.

Dans l'hypothèse de Lorentz, on a:

D=-\frac{dH}{dV}=-\frac{\partial H}{\partial V},


\frac{\partial H}{\partial V} représentant la dérivée par rapport à V, après que r et θ ont été remplacés par leurs valeurs en fonctions de V tirées des deux premières équations (1); on aura d'ailleurs, après cette substitution,

H=+A\sqrt{1-V^{2}}.

Nous choisirons les unités de telle façon que le facteur constant A soit égal a 1, et je pose \sqrt{1-V^{2}}=h, d'où:

H=+h,\quad D=\frac{V}{h},\quad\frac{dD}{dV}=h^{-3},\quad\frac{dD}{dV}\frac{1}{V^{2}}-\frac{D}{V^{3}}=h^{-3}.

Nous poserons encore:

M=V\frac{dV}{dt}=\sum\xi\frac{d\xi}{dt},\quad X_{1}=\int Xd\tau


et nous trouverons pour l'équation du mouvement quasi-stationnaire:

(5) h^{-1}\frac{d\xi}{dt}+h^{-3}\xi M=X_{1}.

Voyons ce que deviennent ces équations par la transformation de Lorentz. Nous poserons: 1-ξε=μ, et nous aurons d'abord:

\mu\xi^{\prime}=\xi+\epsilon,\quad\mu\eta^{\prime}=\frac{\eta}{k},\quad\mu\zeta^{\prime}=\frac{\zeta}{k}


d'où l'on tire aisément

\mu h^{\prime}=\frac{h}{k}.

Nous avons également

dt'=k\ \mu\ dt


d'où:

\frac{d\xi^{\prime}}{dt^{\prime}}=\frac{d\xi}{dt}\frac{1}{k^{3}\mu^{3}},\quad\frac{d\eta^{\prime}}{dt^{\prime}}=\frac{d\eta}{dt}\frac{1}{k^{2}\mu^{2}}-\frac{d\xi}{dt}\frac{\eta\epsilon}{k^{2}\mu^{3}},\quad\frac{d\zeta^{\prime}}{dt^{\prime}}=\frac{d\zeta}{dt}\frac{1}{k^{2}\mu^{2}}-\frac{d\xi}{dt}\frac{\zeta\epsilon}{k^{2}\mu^{3}}


d'où encore:

M^{\prime}=\frac{d\xi}{dt}\frac{\epsilon h^{2}}{k^{3}\mu^{4}}+\frac{M}{k^{3}\mu^{3}}


et

(6) h^{\prime-1}\frac{d\xi^{\prime}}{dt^{\prime}}+h^{\prime-3}\xi^{\prime}M^{\prime}=\left[h^{-1}\frac{d\xi}{dt}+h^{-3}(\xi+\epsilon)M\right]\mu^{-1},
(7) h^{\prime-1}\frac{d\eta^{\prime}}{dt^{\prime}}+h^{\prime-3}\eta^{\prime}M^{\prime}=\left[h^{-1}\frac{d\eta}{dt}+h^{-3}\eta M\right]\mu^{-1}h^{-1}.

Reportons-nous maintenant aux équations (11 bis) du § 1; on peut y regarder X1, Y1, Z1 comme ayant la même signification que dans les équations (5). D'autre part, nous avons l=1 et \frac{\rho^{\prime}}{\rho}=k\mu; ces équations deviennent donc:

(8) \begin{cases} X_{1}^{\prime}=\mu^{-1}\left(X_{1}+\epsilon\sum X_{1}\xi\right),\\ \\Y_{1}^{\prime}=k^{-1}\mu^{-1}Y_{1}.\end{cases}

Calculons ΣX1ξ l'aide des équations (5), nous trouverons:

\Sigma X_{1}\xi=h^{-3}M,


d'où:

(9) \begin{cases} X_{1}^{\prime}=\mu^{-1}\left(X_{1}+\epsilon h^{-3}M\right),\\ \\Y_{1}^{\prime}=k^{-1}\mu^{-1}Y_{1}.\end{cases}

En comparant les équations (5), (6), (7) et (9), on trouve enfin:

(10) \begin{cases} h^{\prime-1}\frac{d\xi^{\prime}}{dt^{\prime}}+h^{\prime-3}\xi^{\prime}M^{\prime}=X_{1}^{\prime},\\ \\h^{\prime-1}\frac{d\eta^{\prime}}{dt^{\prime}}+h^{\prime-3}\eta^{\prime}M^{\prime}=Y_{1}^{\prime}\end{cases}


ce qui montre que les équations du mouvement quasi-stationnaire ne sont pas altérées par la transformation de Lorentz; mais cela ne prouve pas encore que l'hypothèse de Lorentz est la seule qui conduise à ce résultat.

Pour établir ce point, nous allons nous restreindre, ainsi que l'a fait Lorentz, à certains cas particuliers, ce qui nous suffira évidemment pour démontrer une proposition négative.

Comment allons-nous d'abord étendre les hypothèses sur lesquelles reposait le calcul précédent?

1° Au lieu de supposer l=1 dans la transformation de Lorentz, nous supposerons l quelconque.

2° Au lieu de supposer que F est proportionnel au volume, et par conséquent que H est proportionnel à h, nous supposerons que F est une fonction quelconque de θ et de r, de telle façon que [après avoir remplacé θ et r par leurs valeurs en fonctions de V, tirées des deux premières équations (1)] H soit une fonction quelconque de V.

J'observe d'abord que, si l'on suppose H = h, on devra avoir l = 1; et en effet les équations (6) et (7) subsisteront, sauf que les seconds membres seront multipliés par \frac{1}{l}; les équations (9) également, sauf que les seconds membres seront multipliés par \frac{1}{l^{2}}; et enfin les équations (10), sauf que les seconds membres seront multipliés par \frac{1}{l}. Si l'on veut que les équations du mouvement ne soient pas altérées par la transformation de Lorentz, c'est-a-dire que les équations (10) ne différent des équations (5) que par l'accentuation des lettres, il faut supposer:

l = 1.

Supposons maintenant que l'on ait η=ζ=0, d'où ξ=V, \frac{d\xi}{dt}=\frac{dV}{dt}; les équations (5) prendront la forme:

(5bis) -\frac{d}{dt}\frac{dH}{d\xi}=\frac{dD}{dV}\frac{d\xi}{dt}=X_{1},\quad-\frac{d}{dt}\frac{dH}{d\eta}=\frac{D}{V}\frac{d\eta}{dt}=Y_{1}.

Nous pouvons d'ailleurs poser:

\frac{dD}{dV}=f(V)=f(\xi),\quad\frac{D}{V}=\varphi(V)=\varphi(\xi).

Si les équations du mouvement ne son pas altérées par la transformation de Lorentz, on devra avoir:

f(\xi)\frac{d\xi}{dt}=X_{1},

\varphi(\xi)\frac{d\eta}{dt}=Y_{1},

f(\xi^{\prime})\frac{d\xi^{\prime}}{dt^{\prime}}=X_{1}^{\prime}=l^{-2}\mu^{-1}(X_{1}+\epsilon\sum X_{1}\xi)=l^{-2}\mu^{-1}X_{1}(1+\epsilon\xi)=l^{-2}X_{1},

\varphi(\xi^{\prime})\frac{d\eta^{\prime}}{dt^{\prime}}=Y_{1}^{\prime}=l^{-2}k^{-1}\mu^{-1}Y_{1},


et par conséquent:

(11) \begin{cases} f(\xi)\frac{d\xi}{dt}=l^{2}f(\xi^{\prime})\frac{d\xi^{\prime}}{dt^{\prime}},\\ \\\varphi(\xi)\frac{d\eta}{dt}=l^{2}k\mu\varphi(\xi^{\prime})\frac{d\eta^{\prime}}{dt^{\prime}}.\end{cases}

Mais nous avons:

\frac{d\xi^{\prime}}{dt^{\prime}}=\frac{d\xi}{dt}\frac{1}{k^{3}\mu^{3}},\quad\frac{d\eta^{\prime}}{dt^{\prime}}=\frac{d\eta}{dt}\frac{1}{k^{2}\mu^{2}},


d'où:

f(\xi^{\prime})=f\left(\frac{\xi+\epsilon}{1+\xi\epsilon}\right)=f(\xi)\frac{k^{3}\mu^{3}}{l^{2}},

\varphi(\xi^{\prime})=\varphi\left(\frac{\xi+\epsilon}{1+\xi\epsilon}\right)=\varphi(\xi)\frac{k\mu}{l^{2}};


d'où, en éliminant l², nous trouvons l'équation fonctionnelle:

k^{2}\mu^{2}\frac{\varphi\left(\frac{\xi+\epsilon}{1+\xi\epsilon}\right)}{\varphi(\xi)}=\frac{f\left(\frac{\xi+\epsilon}{1+\xi\epsilon}\right)}{f(\xi)},

ou, en posant
\frac{\varphi(\xi)}{f(\xi)}=\Omega(\xi)=\frac{D}{V\frac{dD}{dV}},


celle-ci:

\Omega\left(\frac{\xi+\epsilon}{1+\xi\epsilon}\right)=\Omega(\xi)\frac{1+\epsilon^{2}}{(1+\xi\epsilon)^{2}},


équation qui doit être satisfaite pour toutes les valeurs de ξ et de ε. Pour ζ=0 on trouve:

\Omega(\epsilon)=\Omega(0)\left(1-\epsilon^{2}\right),


d'où:

D=A\left(\frac{V}{\sqrt{1-V^{2}}}\right)^{m},

A étant une constante, et où j'ai fait \Omega(0)=\frac{1}{m}.

On trouve alors:

\varphi(\xi)=\frac{A}{\xi}\left(\frac{\xi}{\sqrt{1-\xi^{2}}}\right)^{m},\quad\varphi(\xi^{\prime})=\frac{A\mu}{\xi+\epsilon}\left(\frac{\xi+\epsilon}{\sqrt{1-\xi^{2}}\sqrt{1-\epsilon^{2}}}\right)^{m}.

Or \varphi(\xi^{\prime})=\varphi(\xi)\frac{k\mu}{l^{2}}; donc on a:

(\xi+\epsilon)^{m-1}\left(1-\epsilon^{2}\right)^{-\frac{m}{2}}=-\xi^{m-1}\left(1-\epsilon^{2}\right)^{-\frac{1}{2}}l^{-2}.

Comme l ne doit dépendre que de ε (puisque, s'il y a plusieurs électrons, l doit être le même pour tous les électrons dont les vitesses ξ peuvent être différentes), cette identité ne peut avoir lieu que si l'on a:

m = 1,\ l = 1.

Ainsi l'hypothèse de Lorentz est la seule qui soit compatible avec l'impossibilité de mettre en évidence le mouvement absolu; si on admet cette impossibilité, il faut admettre que les électrons en mouvement se contractent de façon à devenir des ellipsoïdes de révolution dont deux des axes demeurent constants; il faut donc admettre, comme nous l'avons montré au § précédent, l'existence d'un potentiel supplémentaire proportionnel au volume de l'électron.

L'analyse de Lorentz se trouve donc pleinement confirmée, mais nous pouvons mieux nous rendre compte de la vraie raison du fait qui nous occupe; cette raison doit être cherchée dans les considérations du § 4. Les transformations qui n'altèrent pas les équations du mouvement doivent former un groupe, et cela ne peut avoir lieu que si l=1. Comme nous ne devons pas pouvoir reconnaître si un électron est en repos ou en mouvement absolu, il faut que quand il est en mouvement il subisse une déformation qui doit être précisément celle que lui impose la transformation correspondante du groupe.

§ 8. — Mouvement quelconque.

Les résultats précédents ne s'appliquent qu'au mouvement quasi-stationnaire, mais il est aisé de les étendre au cas général; il suffit d'appliquer les principes du § 3, c'est: à-dire de partir du principe de moindre action.

A l'expression de l'action

J=\int dt\ d\tau\left(\frac{\sum f^{2}}{2}-\frac{\sum\alpha^{2}}{2}\right),


il convient d'ajouter un terme, représentant le potentiel supplémentaire F du § 6; ce terme prendra évidemment la forme:

J_{1}=\int\sum(F)dt


où Σ(F) représente la somme des potentiels supplémentaires dus aux différents électrons, chacun d'eux étant proportionnel au volume de l'électron correspondant.

J'écris (F) entre parenthèses pour ne pas confondre avec le vecteur F, G, H.

L'action totale est alors J+J1. Nous avons vu au § 3 que J n'est pas altéré par la transformation de Lorentz; il faut montrer maintenant qu'il en est de même de J1.

On a, pour l'un des électrons,

(F)=\omega_{0}\tau\,


ω0 étant un coefficient spécial à l'électron et τ son volume; je puis donc écrire:

\sum(F)=\int\omega_{0}d\tau,


l'intégrale devant être étendue á tout l'espace, mais de telle façon que le coefficient ω0 soit nul en dehors des électrons, et qu'à l'intérieur de chaque électron il soit égal au coefficient spécial à cet électron. On a alors:

J_{1}=\int\omega_{0}d\tau\ dt


et après la transformation de Lorentz:

J_{1}^{\prime}=\int\omega_{0}^{\prime}d\tau^{\prime}\ dt^{\prime}.

Or on a ω0=ω'0; car si un point appartient à un électron, le point correspondant après la transformation de Lorentz appartient encore au même électron. D'autre part, nous avons trouvé au § 3;

d\tau'dt'=l^{4}d\tau\ dt


et, puisque nous supposons maintenant l=1,

d\tau'dt'=d\tau\ dt

On a donc

J_{1}=J'_{1}\,. C.Q.F.D.

Le théorème est donc général, il nous donne en même temps une solution de la question que nous nous posions à la fin du § 1: trouver des forces complémentaires non altérées par la transformation de Lorentz. Le potentiel supplémentaire (F) satisfait à cette condition.

Nous pouvons donc généraliser le résultat énoncé à la fin du § 1 et écrire:

Si l'inertie des électrons est exclusivement d'origine électromagnétique, s'ils ne sont soumis qu'à des forces d'origine électromagnétique, ou aux forces qui engendrent le potentiel supplémentaire (F), aucune expérience ne pourra mettre en évidence le mouvement absolu.

Quelles sont alors ces forces qui engendrent le potentiel (F)? Elles peuvent évidemment être assimilées à une pression qui régnerait à l'intérieur de l'électron; tout se passe comme si chaque électron était une capacité creuse soumise à une pression interne constante (indépendante du volume); le travail d'une pareille pression serait évidemment proportionnel aux variations du volume.

Je dois observer toute fois que cette pression est négative. Reprenons l'équation (10) du § 6, qui dans l'hypothèse de Lorentz s'écrit:

F=Ar^{3}\theta^{2};


les équations (11) du § 6 nous donneront:

A=\frac{a}{3b^{4}}.

Notre pression est égale à A, à un coefficient constant près, qui d'ailleurs est négatif.

Évaluons maintenant la masse de l'électron, je veux parler de la «masse expérimentale», c'est-à-dire de la masse pour des vitesses faibles; on a (cf. § 6):

H=\frac{\varphi\left(\frac{\theta}{k}\right)}{k^{2}r},\quad\theta=k,\quad\varphi=a,\quad\theta r=b;


d'où

H=\frac{a}{bk}=\frac{a}{b}\sqrt{1-V^{2}},

Pour V très petit je puis écrire:

H=\frac{a}{b}\left(1-\frac{V^{2}}{2}\right),


de sorte que la masse, tant longitudinale que transversale, sera \frac{a}{b}.

Or a est une constante numérique, ce qui montre que: la pression qui engendre notre potentiel supplémentaire es proportionnelle à la 4' puissante de la masse expérimentale de l'électron.

Comme l'attraction newtonienne est proportionnelle à cette masse expérimentale, on est tenté de conclure qu'il y a quelque relation entre la cause qui engendre la gravitation et celle qui engendre ce potentiel supplémentaire.


§ 9. — Hypothèses sur la Gravitation.

Ainsi la théorie de Lorentz expliquerait complètement l'impossibilité de mettre en évidence le mouvement absolu, si toutes les forces étaient d'origine électromagnétique.

Mais il y a des forces auxquelles on ne peut pas attribuer une origine électromagnétique comme par exemple la gravitation. Il peut arriver, en effet, que deux systèmes de corps produisent des champs électromagnétiques équivalents, c'est-à-dire exerçant la même action sur des corps électrisés et sur des courants, et que cependant ces deux systèmes n'exercent pas la même action gravifique sur les masses newtoniennes. Le champ gravifique est donc distinct du champ électromagnétique. Lorentz a donc été obligé de compléter son hypothèse en supposant que les forces de toute origine, et en particulier la gravitation, sont affectées par une translation (ou, si l'on aime mieux, par la transformation de Lorentz) de la même, manière que les forces électromagnétiques.

Il convient maintenant d'entrer dans les détails et d'examiner de plus près cette hypothèse. Si nous voulons que la force newtonienne soit affectée de cette façon par la transformation de Lorentz, nous ne pouvons plus admettre que cette force dépend uniquement de la position relative du corps attirant et du corps attiré à l'instant considéré. Elle devra dépendre en outre des vitesses des deux corps. Et ce n'est pas tout: il sera naturel de supposer que la force qui agit à l'instant t sur le corps attiré, dépend de la position et de la vitesse de ce corps à ce même instant t; mais elle dépendra, en outre, de la position et de la vitesse du corps attirant, non pas à l'instant t, mais à un instant antérieur, comme si la gravitation avait mis un certain temps à se propager.

Envisageons donc la position du corps attiré à l'instant t0 et soient, à cet instant, x0, y0, z0 ses coordonnées, ξ, η, ζ, les composantes de sa vitesse; considérons d'autre part le corps attirant à l'instant correspondant la t0+t et soient, à cet instant, x0+x, y0+y, z0+z ses coordonnées, ξ1, η1, ζ1 les composantes de sa vitesse.

Nous devrons d'abord avoir une relation

(1) \phi(t,\ x,\ y,\ z,\ \xi,\ \eta,\ \zeta,\ \xi_{1},\ \eta_{1},\ \zeta_{1})=0


pour définir le temps t. Cette relation définira la loi de la propagation de l'action gravifique (je ne m'impose nullement la condition que la propagation se fasse avec la même vitesse dans tous les sens).

Soient maintenant X1, Y1, Z1 les 3 composantes de l'action exercée à l'instant t0 sur le corps attiré; il s'agit d'exprimer X1, Y1, Z1 en fonctions de

(2) t,\ x,\ y,\ z,\ \xi,\ \eta,\ \zeta,\ \xi_{1},\ \eta_{1},\ \zeta_{1}

Quelles sont les conditions à remplir?

1° La condition (1) ne devra pas être altérée par les transformations du groupe de Lorentz.

2° Les composantes X1, Y1, Z1 devront être affectées par les transformations de Lorentz de la même manière que les forces électromagnétiques désignées par les mêmes lettres, c'est-à-dire conformément aux équations (11 bis) du § 1.

3° Quand les deux corps seront au repos, on devra retomber sur la loi ordinaire de l'attraction.

Il importe de remarquer que dans ce dernier cas, la relation (1) disparaît, car le temps t ne joue plus aucun rôle si les deux corps sont au repos.

Le problème ainsi posé est évidemment indéterminé. Nous chercherons donc à satisfaire autant que possible à d'autres conditions complémentaires:

4° Les observations astronomiques ne semblant pas montrer de dérogation sensible à la loi de Newton, nous choisirons la solution qui s'écarte le moins de cette loi, pour de faibles vitesses des deux corps.

5° Nous nous efforcerons de nous arranger de façon que t soit toujours négatif; si en effet on conçoit que l'effet de la gravitation demande un certain temps pour se propager, il serait plus difficile de comprendre comment cet effet pourrait dépendre de la position non encore atteinte par le corps attirant.

Il y a un cas où l'indétermination du problème disparaît; c'est celui où les deux corps sont en repos relatif l'un par rapport à l'autre, c'est-à-dire où:

\xi=\xi_{1},\ \eta=\eta_{1},\ \zeta=\zeta_{1}\,;


c'est donc le cas que nous allons examiner d'abord, en supposant que ces vitesses sont constantes, de telle sorte que les deux corps sont entraînés dans un mouvement de translation commun, rectiligne et uniforme.

Nous pourrons supposer que l'axe des x a été pris parallèle à cette translation, de telle façon que η=ζ=0, et nous prendrons ε=-ξ.

Si dans ces conditions nous appliquons la transformation de Lorentz, après la transformation les deux corps seront au repos et l'on aura:

\xi'=\eta'=\zeta'=0\,

Alors les composantes X'0, Y'0, Z'0 devront être conformes à la loi de Newton et on aura, à un facteur constant près:

(3) \begin{cases} X_{1}^{\prime}=-\frac{x^{\prime}}{r^{\prime3}},\quad Y_{1}^{\prime}=-\frac{y^{\prime}}{r^{\prime3}},\quad Z_{1}^{\prime}=-\frac{z^{\prime}}{r^{\prime3}},\\ \\r^{\prime2}=x^{\prime2}=y^{\prime2}+z^{\prime2}.\end{cases}

Mais on a, d'après le § 1:

\begin{array}{l}
x^{\prime}=k(x+\epsilon t),\quad y^{\prime}=y,\quad z^{\prime}=z,\quad t^{\prime}=k(t+\epsilon x),\\
\\
\frac{\rho^{\prime}}{\rho}=k(1+\xi\epsilon)=k\left(1-\epsilon^{2}\right)=\frac{1}{k},\quad\sum X_{1}\xi=-X_{1}\epsilon,\\
\\
X_{1}^{\prime}=k\frac{\rho}{\rho^{\prime}}\left(X_{1}+\epsilon\sum X_{1}\xi\right)=k^{2}X_{1}\left(1-\epsilon^{2}\right)=X_{1},\\
\\
Y_{1}^{\prime}=\frac{\rho}{\rho^{\prime}}Y_{1}=kY_{1},\\
\\
Z_{1}^{\prime}=kZ_{1}.
\end{array}

On a d'ailleurs:

x+\epsilon t=x-\xi t,\quad r^{\prime2}=k^{2}(x-\xi t)^{2}+y^{2}+z^{2}


et

(4) X_{1}=\frac{-k(x-\xi t)}{r^{\prime3}},\quad Y_{1}=\frac{-y}{kr^{\prime3}},\quad Z_{1}=\frac{-z}{kr^{\prime3}};


ce qui peut s'écrire:

(4bis) X_{1}=\frac{dV}{dx},\quad Y_{1}=\frac{dV}{dy},\quad Z_{1}=\frac{dV}{dz};\quad V=\frac{1}{kr^{\prime}}.

Il semble d'abord que l'indétermination subsiste, puisque nous n'avons fait aucune hypothèse sur la valeur de t c'est-à-dire sur la rapidité de la transmission; et que d'ailleurs x est fonction de t; mais il est aisé de voir que x-ξt, y, z, qui figurent seuls dans nos formules, ne dépendent pas de t.

On voit que si les deux corps sont simplement animés d'une translation commune, la force qui agit sur le corps attiré est normale à un ellipsoïde ayant pour centre le corps attirant.

Pour aller plus loin il faut chercher les invariants du groupe de Lorentz.

Nous savons que les substitutions de ce groupe (en supposant l=1) sont les substitutions linéaires qui n'altèrent pas la forme quadratique

x^2 + y^2 + z^2 - t^2.\,

Posons d'autre part:

\begin{array}{l}
\xi=\frac{\delta x}{\delta t},\quad\eta=\frac{\delta y}{\delta t},\quad\zeta=\frac{\delta z}{\delta t};\\
\\
\xi_{1}=\frac{\delta_{1}x}{\delta_{1}t},\quad\eta_{1}=\frac{\delta_{1}y}{\delta_{1}t},\quad\zeta_{1}=\frac{\delta_{1}z}{\delta_{1}t};
\end{array}


nous voyons que la transformation de Lorentz aura pour effet de faire subir δx, δy, δz, δt et à δ1x, δ1y, δ1z, δ1t les mêmes substitutions linéaires qu'à x, y, z, t.

Regardons

\begin{array}{ccccccc} x, & & y, & & z, & & t\sqrt{-1},\\ \\\delta x, & & \delta y, & & \delta z, & & \delta t\sqrt{-1},\\ \\\delta_{1}x, & & \delta_{1}y, & & \delta_{1}z, & & \delta_{1}t\sqrt{-1},\end{array}


comme les coordonnées de 3 points P, P', P" dans l'espace à 4 dimensions. Nous voyons que la transformation de Lorentz n'est qu'une rotation de cet espace autour de l'origine, regardée comme fixe. Nous n'aurons donc pas d'autres invariants distincts que les 6 distances des 3 points P, P', P" entre eux et á l'origine, ou, si l'on aime mieux, que les 2 expressions:

x^{2}+y^{2}+z^{2}-t^{2},\ x\delta x+y\delta y+z\delta z-t\delta t


ou les 4 expressions de même forme qu'on en déduit en permutant d'une manière quelconque les 3 points P, P', P".

Mais ce que nous cherchons ce sont les fonctions des 10 variables (2) qui sont des invariants; nous devons donc, parmi les combinaisons de nos 6 invariants, rechercher celles qui ne dépendent que de ces 10 variables, c'est-â-dire celles qui sont homogènes de degré 0 tant par rapport à δx, δy, δz, δt, que par rapport à δ1x, δ1y, δ1z, δ1t. Il nous restera ainsi 4 invariants distincts, qui sont:

(5) \sum x^{2}-t^{2},\quad\frac{t-\sum x\xi}{\sqrt{1-\sum\xi^{2}}},\quad\frac{t-\sum x\xi_{1}}{\sqrt{1-\sum\xi_{1}^{2}}},\quad\frac{t-\sum\xi\xi_{1}}{\sqrt{\left(1-\sum\xi^{2}\right)\left(1-\sum\xi_{1}^{2}\right)}}

Occupons-nous maintenant des transformations subies par les composantes de la force; reprenons les équations (11) du § 1, qui se rapportent non à la force X1, Y1, Z1, que nous considérons ici, mais à la force X, Y, Z rapportée à l'unité de volume. Posons d'ailleurs:

T=\sum X\xi;


nous verrons que ces équations (11) peuvent s'écrire (l=1):

(6) \begin{cases} X^{\prime}=k(X+\epsilon T),\quad & T^{\prime}=k(T+\epsilon X),\\ \\Y^{\prime}=Y, & Z^{\prime}=Z;\end{cases}


de sorte que X, Y, Z, T subissent la même transformation que x, y, z, t. Les invariants du groupe seront donc

\sum X^{2}-T^{2},\quad\sum Xx-Tt,\quad\sum X\delta x-T\delta t,\quad\sum X\delta_{1}x-T\delta_{1}t.

Mais ce n'est pas de X, Y, Z que nous avons besoin, c'est de X1, Y1, Z1 avec

T_{1}=\sum X_{1}\xi.

Nous voyons que

\frac{X_{1}}{X}=\frac{Y_{1}}{Y}=\frac{Z_{1}}{Z}=\frac{T_{1}}{T}=\frac{1}{\rho}.

Donc la transformation de Lorentz agira sur X1, Y1, Z1, T1 de la même manière que sur X, Y, Z, T, avec cette différence que ces expressions seront en outre multipliées par

\frac{\rho}{\rho^{\prime}}=\frac{1}{k(1+\xi\epsilon)}=\frac{\delta t}{\delta t^{\prime}}.

De même elle agira sur ξ, η, ζ, 1, de la même manière que sur δx, δy, δz, δt, avec cette différence que ces expressions seront en outre multipliées par le même facteur:

\frac{\delta t}{\delta t^{\prime}}=\frac{1}{k(1+\xi\epsilon)}.

Considérons alors X,\ Y,\ Z,\ T\sqrt{-1} comme les coordonnées d'un quatrième point Q; alors les invariants seront les fonctions des distances mutuelles des cinq points

0,\ P,\ P',\ P'',\ Q


et parmi ces fonctions nous devons conserver seulement celles qui sont homogènes de degré 0, d'une part par rapport à

X,\ Y,\ Z,\ T,\ \delta x,\ \delta y,\ \delta z,\ \delta t


(variables que l'on peut remplacer ensuite par X1, Y1, Z1, T1, ξ, η, ζ, 1), d'autre part par rapport à

\delta_{1}x,\ \delta_{1}y,\ \delta_{1}z,\ 1


(variables que l'on peut remplacer ensuite par ξ1, η1, ζ1, 1).

Nous trouvons ainsi outre les quatre invariants (5), quatre invariants distincts nouveaux, qui sont:

(7) \frac{\sum X_{1}^{2}-T_{1}^{2}}{1-\sum\xi^{2}},\quad\frac{\sum X_{1}x-T_{1}t}{\sqrt{1-\sum\xi^{2}}},\quad\frac{\sum X_{1}\xi_{1}-T}{\sqrt{1-\sum\xi^{2}}\sqrt{1-\sum\xi_{1}^{2}}},\quad\frac{\sum X_{1}\xi-T_{1}}{1-\sum\xi^{2}}.

Le dernier invariant est toujours nul, d'après la définition de T1.

Cela posé, quelles sont les conditions à remplir?

1° Le premier membre de la relation (1), qui définit la vitesse de propagation, doit être une fonction des 4 invariants (5),

On peut faire évidemment une foule d'hypothèses; nous n'en examinerons que deux:

A) On peut avoir

\sum x^{2}-t^{2}=r^{2}-t^{2}=0,


d'où t=\pm r, et, puisque t doit être négatif, t=-r. Cela veut dire que la vitesse de propagation est égale à celle de la lumière. Il semble d'abord que cette hypothèse doive être rejetée sans examen. Laplace a montré en effet que cette propagation est, ou bien instantanée, ou beaucoup plus rapide que celle de la lumière. Mais Laplace avait examiné l'hypothèse de la vitesse finie de propagation, ceteris non mutatis; ici, au contraire, cette hypothèse est compliquée de beaucoup d'autres, et il peut se faire qu'il y ait entre elles une compensation plus ou moins parfaite, comme celles dont leu applications de la transformation de Lorentz nous ont déjà donné tant d'exemples.

B) On peut avoir

\frac{t-\sum x\xi_{1}}{\sqrt{1-\sum\xi_{1}^{2}}}=0,\quad t=\sum x\xi.

La vitesse de propagation est alors beaucoup plus rapide que celle de la lumière; mais dans certains cas t pourrait être négatif, ce qui, comme nous l'avons dit, ne paraît guère admissible. Nous nous en tiendrons donc a l'hypothèse (A).

2° Les quatre invariants (7) doivent être des fonctions des invariants (5).

3° Quand te deux corps sont en repos absolu X1, Y1, Z1 doivent avoir la valeur déduite de la loi de Newton, et quand ils sont en repos relatif, la valeur déduite des équations (4).

Dans l'hypothèse du repos absolu, les deux premiers invariants (7) doivent se réduire à

\sum X_{1}^{2},\quad\sum X_{1}x,


ou, par la loi de Newton, à

\frac{1}{r^{4}},\quad-\frac{1}{r}


d'autre part, dans l'hypothèse (A), le 2d et le 3d des invariants (5) deviennent:

\frac{-r-\sum x\xi}{\sqrt{1-\sum\xi^{2}}},\quad\frac{-r-\sum x\xi_{1}}{\sqrt{1-\sum\xi_{1}^{2}}}


c'est-à-dire, pour le repos absolu, à

-r,\ -r.

Nous pouvons donc admettre par exemple que les deux premiers invariants (4) se réduisent à

\frac{\left(1-\sum x\xi_{1}^{2}\right)^{2}}{\left(r+\sum x\xi_{1}\right)^{4}},\quad-\frac{\sqrt{1-\sum\xi_{1}^{2}}}{r+\sum x\xi_{1}},


mais d'autres combinaisons sont possibles.

Il faut faire un choix entre ces combinaisons, et, d'autre part, pour définir X1, Y1, Z1, il nous faut une 3e équation. Pour un pareil choix, nous devons nous efforcer de nous rapprocher autant que possible de la loi de Newton. Voyons donc ce qui se passe quand (faisant toujours t=-r) on néglige les carrés des vitesses ξ η etc. Les 4 invariants (5) deviennent alors:

0,\quad-r-\sum x\xi,\quad-r-\sum x\xi_{1},\quad1


et les 4 invariants (7):

\sum X_{1}^{2},\quad\sum X_{1}(x+\xi r),\quad\sum X_{1}\left(\xi_{1}-\xi\right),\quad0.

Mais pour pouvoir comparer avec la loi de Newton, une autre transformation est nécessaire; ici x0+x, y0+y, z0+z représentent les coordonnées du corps attirant à l'instant t0+x, , et r=\sqrt{\sum x^{2}}; dans la loi de Newton il faut envisager les coordonnées x0+x1, y0+y1, z0+z1 du corps attirant à l'instant t0, et la distance r_{1}=\sqrt{\sum x^{2}_{1}}.

Nous pouvons négliger le carré du temps t nécessaire à la propagation et par conséquent faire comme si le mouvement était uniforme; nous avons alors:

x=x_{1}+\xi_{1}t,\quad y=y_{1}+\eta_{1}t,\quad z=z_{1}+\zeta_{1}t,\quad r\left(r-r_{1}\right)=\sum x\xi_{1}t

ou, puisque t=-r,
x=x_{1}-\xi_{1}r,\quad y=y_{1}-\eta_{1}r,\quad z=z_{1}-\zeta_{1}r,\quad r=r_{1}-\sum x\xi_{1};


de sorte que nos 4 invariants (5) deviennent:

0,\quad-r_{1}+\sum x\left(\xi_{1}-\xi\right),\quad-r_{1},\quad1


et nos 4 invariants (7):

\sum X_{1}^{2},\quad\sum X_{1}\left[x_{1}+\left(\xi-\xi_{1}\right)r_{1}\right],\quad\sum X_{1}\left(\xi_{1}-\xi\right),\quad0.

Dans la seconde de ces expressions j'ai écrit r1 au lieu de r, parce que r est multiplié par ξ-ξ1 et que je néglige le carré de ξ.

D'autre part, la loi de Newton nous donnerait, pour ces 4 invariants (7),

\frac{1}{r_{1}^{4}},\quad-\frac{1}{r_{1}}-\frac{\sum x_{1}\left(\xi-\xi_{1}\right)}{r_{1}^{2}},\quad\frac{\sum x_{1}\left(\xi-\xi_{1}\right)}{r_{1}^{3}},\quad0.

Si donc nous appelons A et B, le 2d et le 3e des invariants (7), et M, N, P les 3 premiers invariants (7), nous satisferons à la loi de Newton, aux termes près de l'ordre du carré des vitesses, en faisant:

(8) M=\frac{1}{B^{4}},\quad N=\frac{+A}{B^{2}},\quad P=\frac{A-B}{B^{3}}.

Cette solution n'est pas unique. Soit en effet C le 4e invariant (5), C-1 est de l'ordre du carré de ξ, et il en est de même de (A-B)².

Nous pourrions donc ajouter aux 2ds membres de chacune des équations (8) un terme formé de C-1 multiplié par une fonction arbitraire de A, B, C et un terme formé de (A-B)² multiplié également par une fonction de A, B, C.

Au premier abord, la solution (8) parait la plus simple, elle ne peut néanmoins être adoptée; en effet, comme M, N, P sont des fonctions de X1, Y1, Z1 et de T_{1}=\sum X_{1}\xi, on peut tirer de ces trois équations (8) les valeurs de X1, Y1, Z1; mais dans certains cas ces valeurs deviendraient imaginaires.

Pour éviter cet inconvénient, nous opérerons d'une autre manière. Posons:

k_{0}=\frac{1}{\sqrt{1-\sum\xi^{2}}},\quad k_{1}=\frac{1}{\sqrt{1-\sum\xi_{1}^{2}}}


ce qui est justifié par l'analogie avec la notation

k=\frac{1}{\sqrt{1-\epsilon^{2}}}.


qui figure dans la substitution de Lorentz.

Dans ce cas, et à cause de la condition -r=t, les invariants (5) deviennent:

0,\quad A=-k_{0}(r+\sum x\xi),\quad B=-k_{1}\left(r+\sum x\xi_{1}\right),\quad C=k_{0}k_{1}\left(1-\sum\xi\xi_{1}\right).

D'autre part, nous voyons que les systèmes suivants de quantités:

\begin{array}{ccccccc}
x, &  & y, &  & z, &  & -r=t\\
\\
k_{0}X_{1}, &  & k_{0}Y_{1}, &  & k_{0}Z_{1}, &  & k_{0}T_{1}\\
\\
k_{0}\xi, &  & k_{0}\eta, &  & k_{0}\zeta, &  & k_{0}\\
\\
k_{1}\xi_{1}, &  & k_{1}\eta_{1}, &  & k_{1}\zeta_{1}, &  & k_{1}
\end{array}


subissent les mêmes substitutions linéaires quand on leur applique les transformations du groupe de Lorentz. Nous sommes donc conduits à poser:

(9) \begin{cases} X_{1}=x\frac{\alpha}{k_{0}}+\xi\beta+\xi_{1}\frac{k_{1}}{k_{0}}\gamma,\\ \\Y_{1}=y\frac{\alpha}{k_{0}}+\eta\beta+\eta_{1}\frac{k_{1}}{k_{0}}\gamma,\\ \\Z_{1}=z\frac{\alpha}{k_{0}}+\zeta\beta+\zeta_{1}\frac{k_{1}}{k_{0}}\gamma,\\ \\T_{1}=-r\frac{\alpha}{k_{0}}+\beta+\frac{k_{1}}{k_{0}}\gamma,\end{cases}

Il est clair que si α, β, γ sont des invariants, X1, Y1, Z1, T1 satisferont à la condition fondamentale, c'est-à-dire subiront, par l'effet de transformations de Lorentz, une substitution linéaire convenable.

Mais pour que les équations (9) soient compatibles, il faut que l'on ait:

\sum X_{1}\xi-T_{1}=0,


ce qui, en remplaçant X1, Y1, Z1, T1 par leurs valeurs (9) et en multipliant par k²0, devient:

(10) -A\alpha-\beta-C\gamma=0.\,

Ce que nous voulons, c'est que si l'on néglige, devant le carré de la vitesse de la lumière, les carrés des vitesses ξ, etc., ainsi que le produit des accélérations par les distances, comme nous l'avons fait plus haut, les valeurs de X1, Y1, Z1 restent conformes à la loi de Newton.

Nous pourrons prendre:

\beta=0,\quad\gamma=-\frac{A\alpha}{C}.

Avec l'ordre d'approximation adopté, on a:

(10) k_{0}=k_{1}=1,\quad C=1,\quad A=-r_{1}+\sum x\left(\xi_{1}-\xi\right),\quad B=-r_{1},

x=x_{1}+\xi_{1}t=x_{1}-\xi_{1}r

La 1ere équation (9) devient alors:

X_{1}=\alpha\left(x-A\xi_{1}\right)

Mais si on néglige le carré de ξ, on peut remplacer Aξ1, par -r1ξ1, ou encore par -rξ1 ce qui donne:

X_{1}=\alpha\left(x+\xi_{1}r\right)=\alpha x_{1}

La loi de Newton donnerait

X_{1}=-\frac{x_{1}}{r_{1}^{3}}.

Nous devons donc choisir, pour l'invariant α, celui qui se réduit à -\frac{1}{r_{1}^{3}} à l'ordre d'approximation adopté, c'est-à-dire \frac{1}{B^{3}}. Les équations (9) deviendront:

(11) \begin{cases} X_{1}=\frac{x}{k_{0}B^{3}}-\xi_{1}\frac{k_{1}}{k_{0}}\frac{A}{B^{3}C},\\ \\Y_{1}=\frac{y}{k_{0}B^{3}}-\eta_{1}\frac{k_{1}}{k_{0}}\frac{A}{B^{3}C},\\ \\Z_{1}=\frac{z}{k_{0}B^{3}}-\zeta_{1}\frac{k_{1}}{k_{0}}\frac{A}{B^{3}C},\\ \\T_{1}=-\frac{r}{k_{0}B^{3}}-\frac{k_{1}}{k_{0}}\frac{A}{B^{3}C}.\end{cases}

Nous voyons d'abord que l'attraction corrigée se compose de deux composantes; l'une parallèle au vecteur qui joint les positions des deux corps, l'autre parallèle à la vitesse du corps attirant.

Rappelons que quand nous parlons de la position ou de la vitesse du corps attirant, il s'agit de sa position ou de sa vitesse au moment où l'onde gravifique le quitte; pour le corps attiré, au contraire, il s'agit de sa position ou de sa vitesse du moment où l'onde gravifique l'atteint, cette onde étant supposée se propager avec la vitesse de la lumière.

Je crois qu'il serait prématuré de vouloir pousser plus loin la discussion de ces formules; je me bornerai donc à quelques remarques.

1° Les solutions (11) ne sont pas uniques; on peut, en effet, remplacer \frac{1}{B^{3}} qui entre en facteur partout, par

\frac{1}{B^{3}}+(C-1)f_{1}(A,B,C)+(A-B)^{2}f_{2}(A,B,C),


f1 et f2 étant des fonctions arbitraires de A, B, C, ou encore ne plus prendre β nul, mais ajouter à α β γ des termes complémentaires quelconques, pourvu qu'ils satisfassent a la condition (10) et qu'ils soient du 2d ordre par rapport aux ξ, en ce qui concerne α, et du 1er ordre en ce qui concerne β a γ.

2° La 1ere équation (11) peut s'ecrire:

(11bis) X_{1}\frac{k_{1}}{B^{3}C}\left[x\left(1-\sum\xi\xi_{1}\right)+\xi_{1}\left(r+\sum x\xi\right)\right]


et la quantité entre crochets peut, elle-même, s'écrire:

(12) \left(x+r\xi_{1}\right)+\eta\left(\xi_{1}y-x\eta_{1}\right)+\zeta\left(\xi_{1}z-x\zeta_{1}\right),
de sorte que la force totale peut être partagée en trois composantes correspondant aux trois parenthèses de l'expression (12); la première composante a une vague analogie avec la force mécanique due au champ électrique, les deux autres avec la force mécanique due au champ magnétique; pour compléter l'analogie je puis, en vertu de la 1ere remarque, remplacer dans les équations (11) \frac{1}{B^{3}} par \frac{C}{B^{3}}, de façon que X1, Y1, Z1 ne dépendent plus que linéairement de la vitesse ξ, η, ζ du corps attiré, puisque C a disparu du dénominateur de (11 bis).

Posons alors:

(13) \begin{cases}
k_{1}(x+r\xi_{1})=\lambda,\quad k_{1}(y+r\eta_{1})=\mu,\quad k_{1}(z+r\zeta_{1})=\nu,\\
\\
k_{1}\left(\eta_{1}z-\zeta_{1}y\right)=\lambda^{\prime},\quad k_{1}\left(\zeta_{1}x-\xi_{1}z\right)=\mu^{\prime},\quad k_{1}\left(\xi_{1}y-x\eta_{1}\right)=\nu^{\prime};
\end{cases}


il viendra, C ayant disparu du dénominateur de (11 bis):

(14) \begin{cases} X_{1}=\frac{\lambda}{B^{3}}+\frac{\eta\nu^{\prime}-\zeta\mu^{\prime}}{B^{3}},\\ \\Y_{1}=\frac{\mu}{B^{3}}+\frac{\zeta\lambda^{\prime}-\xi\nu^{\prime}}{B^{3}},\\ \\Z_{1}=\frac{\nu}{B^{3}}+\frac{\xi\mu^{\prime}-\eta\lambda^{\prime}}{B^{3}},\end{cases}


et on aura d'ailleurs:

(15) B^{2}=\sum\lambda^{2}-\sum\lambda^{\prime2}.

Alors λ, μ, ν ou \frac{\lambda}{B^{3}},\frac{\mu}{B^{3}},\ \frac{\nu}{B^{3}} est une espèce de champ électrique, tandis que λ', μ', ν' ou plutôt \frac{\lambda^{\prime}}{B^{3}},\frac{\mu^{\prime}}{B^{3}},\ \frac{\nu^{\prime}}{B^{3}} est une espèce de champ magnétique.

3° Le postulat de relativité nous obligerait à adopter la solution (11) ou la solution (14) ou l'une quelconque des solutions qui s'en déduiraient à l'aide de la 1ere remarque; mais la première question qui se pose est celle de savoir si elles sont compatibles avec les observations astronomiques; la divergence avec la loi de Newton est de l'ordre de ξ² c'est-à-dire 10000 fois plus petite que si elle était de l'ordre de ξ, c'est-à-dire si la propagation se faisait avec la vitesse de la lumière, ceteris non mutatis; il est donc permis d'espérer qu'elle ne sera pas trop grande. Mais une discussion approfondie pourra seule nous l'apprendre.

Paris, juillet 1905.
H. Poincaré



Notes[modifier]

  1. Langevin avait été devancé par M. Bucherer de Bonn, qui a émis avant lui la même idée. (Voir: Bucherer, Mathematische Einführung in die Elektronentheorie; août 1904. Teubner, Leipzig).