Les Aspects successifs du principe de relativité

La bibliothèque libre.
Aller à : navigation, rechercher


Les Aspects successifs du principe de relativité
1920

La physique depuis vingt ans

LES ASPECTS SUCCESSIFS DU PRINCIPE DE RELATIVITE

  • Communication faite à la Société Française de Physique le 6 février 1920.

Des confirmations expérimentales remarquables ont récemment imposé la théorie de la relativité à l’attention des physiciens : sous la forme généralisée que lui a donnée M. Einstein, elle explique complètement le mouvement du périhélie de Mercure, sans introduction d’aucune hypothèse ou constante arbitraire, et elle prévoit quantitativement la déviation des rayons lumineux par le champ de gravitation du Soleil telle que l’ont donnée les mesures faites au cours de l’éclipse totale du 29 mai dernier. Le développement de cette théorie s’est fait en deux étapes : celle de la relativité restreinte, de 1905 à 1912, et celle de la relativité généralisée dont les résultats essentiels ont été acquis à la fin de 1915. La première forme du principe de relativité, restreinte aux mouvements de translation uniforme, aboutit à des conséquences expérimentales non moins importantes que celles du principe généralisé. Le point de départ de la théorie est expérimental aussi : c’est le fait, vérifié avec une très grande précision, que les phénomènes physiques suivent les mêmes lois sur tous les systèmes matériels en mouvement de translation uniforme les uns par rapport aux autres. En particulier, la Terre prise sur son orbite dans deux positions diamétralement opposées, à six mois d’intervalle, est liée à des systèmes d’axes qui se meuvent l’un par rapport à l’autre avec une vitesse de translation de 60 km par seconde et aucune expérience mettant en jeu des phénomènes terrestres ne nous permet de différencier ces deux positions. On est ainsi conduit à énoncer un principe de relativité restreinte :

Les équations qui traduisent les lois de la physique doivent être les mêmes pour tous les systèmes de référence en translation uniforme les uns par rapport aux autres ; elles doivent conserver leur forme quand on y substitue, aux mesures faites sur un phénomène par un premier groupe d’observateurs, leurs expressions en fonction des mesures faites par un autre groupe en mouvement de translation quelconque par rapport au premier.

Cette condition est effectivement remplie par deux théories : la mécanique rationnelle d’abord, dont les équations conservent leur forme quand on y effectue sur les variables d’espace et de temps x, y, z, t, qui déterminent la situation d’un événement quelconque par rapport à un événement origine arbitrairement choisi, les substitutions du groupe de Galilée dont la forme la plus simple, relative au passage d’un système de référence (x, y, z, t) à un autre (x’, y’, z’, t’) en mouvement uniforme par rapport au premier avec la vitesse v dans la direction des x, les axes étant supposés parallèles dans les deux systèmes, est donnée par

(1) x = x’+v*t’, y = y’, z = z’, t = t’.

Ce groupe est caractérisé :

  • 1) Par la notion de temps absolu que traduit la dernière des équations (1). Elle exprime que l’intervalle de temps entre deux événements distants ou non dans l’espace est toujours mesuré (moyennant l’emploi des mêmes unités) de la même manière quel que soit le système de référence. En particuliers deux événements simultanés (t’= 0) pour un groupe d’observateurs sont simultanés (t = 0) pour tous autres en mouvement par rapport au premier.
  • 2) Par la notion d’espace absolu : la forme d’un corps, définie par l’ensemble des positions simultanées de ses points s’il est en mouvement, est la même pour tous les systèmes de référence puisque la simultanéité a le même sens pour tous.
  • 3) Par la formule habituelle de composition des vitesses v(1) = v + v’. La seconde théorie dont les équations satisfont au principe de relativité restreinte est la théorie électromagnétique sous la forme que lui ont donnée Maxwell, Hertz et Lorentz.

M. Lorentz a montré que ces équations conservent leur forme quand, et seulement quand, on y effectue sur les variables d’espace et de temps les substitutions du groupe de Lorentz dont la forme la plus simple est donnée par les équations suivantes, où beta représente le rapport v/V de la vitesse relative des deux systèmes de référence à la vitesse de la lumière qui s’introduit par l’intermédiaire de la relation V=1/(sqrt(K*mu)),

(2) x = (1/sqrt(1-(beta^2)))*(x’+v*t’), y = y’, z = z’, t = (1/sqrt(1-(beta^2)))*(t’+(v/V^2)*x’).

Ce groupe est caractérisé par :

  • 1) Le caractère relatif du temps : deux événements simultanés pour un système de référence (t = 0) ne le seront pas en général pour un autre s’ils se passent en des lieux différents (x><0).
  • 2) Le caractère relatif de l’espace : les positions simultanées des différents points matériels d’un même corps n’étant pas définies de la même manière par différents groupes d’observateurs, le corps n’aura pas la même forme pour tous. En particulier, il paraîtra d’autant plus aplati dans la direction du mouvement (contraction de Lorentz) que les observateurs le verront en mouvement plus rapide.
  • 3) La composition des vitesses : en différentiant la première et la dernière des équations (2) et en divisant membre à membre, on obtient, si v et v’ sont les vitesses dx/dt et dx’/dt' un même mobile par rapport aux deux systèmes de référence :

(3) v(1) = (v+v’)/(1+v*v’/V^2)

La différence profonde qui résulte des faits précédents entre la mécanique rationnelle et la théorie électromagnétique (et qui démontre l’impossibilité d’une explication mécanique des phénomènes électromagnétiques et optiques) peut encore s’exprimer en disant que la théorie électromagnétique utilise le temps optique, alors que la mécanique rationnelle utilise le temps absolu. On retrouve en effet le groupe de Lorentz en admettant qu’on emploie, pour réaliser la concordance des temps en des lieux différents, la méthode des signaux optiques ou électromagnétiques (T. S. F.) et en s’appuyant sur le fait expérimental (Michelson et Morley) que la lumière se propage avec la même vitesse V dans toutes les directions, pour tous les systèmes de référence, quelle que soit leur translation uniforme relative. Cette propagation isotrope de la lumière est d’ailleurs exactement conforme aux prévisions de la théorie électromagnétique. Les transformations de la nouvelle cinématique possèdent la propriété, conséquence nécessaire de ce qui précède, de laisser invariante la quantité

(4) s^2 = t^2 — l^2/V^2,

où t est l’intervalle dans le temps de deux événements et l^2 = x^2 + y^2 + z^2 leur distance dans l’espace. Pour deux événements infiniment voisins, cet invariant devient

(5) ds^2 = dt^2 — (1/(V^2))*(dx^2 + dy^2 + dz^2).

On voit que si le signal employé pour établir la concordance des temps en différents points se propageait avec une vitesse infinie, l’invariant ds se confondrait avec dt et l’on retrouverait le temps absolu de la mécanique rationnelle. Cette notion est donc connexe de celle du solide invariable ou de tout autre moyen de signalisation instantanée à distance, moyens que l’expérience ne nous donne pas. La cinématique du groupe de Lorentz (cinématique d’Einstein) est au contraire fondée sur les bases expérimentales suivantes : 1) L’équivalence physique des systèmes de référence en translation relative uniforme ; 2) Le fait que la seule mesure expérimentale du temps en des lieux différents est obtenue par l’emploi de signaux optiques ou électromagnétiques (temps optique) ; 3) Le fait expérimental que pour tous les systèmes de référence en translation relative uniforme, la lumière se propage avec la même vitesse dans toutes les directions.

Diverses conséquences expérimentales sont venues justifier le nouveau point de vue dont l’opposition avec l’ancienne cinématique représente un des aspects du conflit entre les théories d’action instantanée à distance (mécanique rationnelle, mécanique céleste de Newton) et celui des actions de proche en proche, introduit Par Huygens et Faraday à l’origine du développement de l’optique et de l’électromagnétisme.

L’entraînement des ondes. — La formule (3) de composition des vitesses donne une explication purement cinématique de la loi célèbre d’entraînement partiel des ondes lumineuses par les milieux réfringents, introduite par Fresnel et vérifiée expérimentalement par Fizeau. Si U = V/n est la vitesse des ondes par rapport à un milieu réfringent d’indice n, en mouvement lui-même avec la vitesse v dans la direction de propagation, la vitesse U(1) des ondes par rapport aux observateurs sera, d’après (3),

U(1) = (v+U)/[1+(v*U)/(V^2)] = U + v*(1 — (1/(n^2))),

en limitant le développement aux termes du premier ordre en v. C’est exactement la loi d’entraînement.

La dynamique de la relativité. — À la nouvelle cinématique correspond une dynamique nouvelle, plus simple que l’ancienne pour les raisons suivantes :

  • 1) La loi d’inertie d’après laquelle un point matériel libre prend un mouvement rectiligne et uniforme s’y exprime par la condition

(6) delta*sum(ds) = 0,

l’intégrale étant prise entre deux événements donnés de la ligne d’univers parcourue par le mobile. Le mouvement rectiligne et uniforme joue ainsi dans l’univers de la relativité restreinte le rôle que joue la ligne droite dans la géométrie euclidienne. Il est une géodésique de cet univers ainsi d’ailleurs que les rayons lumineux qui sont des géodésiques de longueur nulle puisque chaque élément ds y est nul d’après la définition (5) de l’invariant ds. Nous appellerons par analogie univers euclidien l’univers de la relativité restreinte défini au point de vue cinématique par les transformations du groupe de Lorentz.

  • 2) La notion de masse se confond avec celle d’énergie : la masse d’un système matériel n’est plus constante comme en mécanique rationnelle, mais varie proportionnellement à l’énergie totale E du système d’après la relation (cf. L’inertie de l’énergie et ses conséquences) :

(7) m = E/(V^2)

En particulier, l’accroissement d’énergie d’un mobile avec la vitesse (énergie cinétique) s’accompagne d’un accroissement de masse avec la vitesse suivant la formule

(8) m = m(0)/(sqrt(1-(beta^2)))

m(0) étant la masse du mobile pris au repos. Cette variation (8) a été vérifiée expérimentalement sur les particules cathodiques jusqu’à des vitesses de 150 000 km par seconde (beta=1/2) par MM. Ch.-Eug. Guye et Lavanchy, et sur les particules beta des corps radioactifs jusqu’à des vitesses très voisines de la vitesse de la lumière. L’application de la nouvelle dynamique aux mouvements intra-atomiques (modèle d’atome de M. Bohr) a permis à M. Sommerfeld de prévoir quantitativement la structure des raies de la série de Balmer de l’hydrogène ainsi que celle de la série K des spectres de rayons X jusqu’aux éléments les plus élevés comme l’uranium. La loi d’inertie de l’énergie interprète immédiatement la pression de radiation (inertie de l’énergie rayonnante) ainsi que les petits écarts entre les masses atomiques des éléments et les multiples entiers de celui de l’hydrogène, en accord avec la doctrine de l’unité de la matière que l’expérience impose aujourd’hui. Les variations de masses ainsi prévues s’accompagnant de variations de poids (par suite de la constance de l’accélération de la pesanteur pour les différents corps, vérifiée expérimentalement avec une très haute précision par M. Eötvös), nous sommes conduits à admettre que l’énergie est pesante en même temps qu’inerte, première indication d’un lien entre les phénomènes de gravitation et les phénomènes électromagnétiques. Le développement des conséquences de cette remarque a conduit M. Einstein à la généralisation du principe de relativité par une voie analogue à celle qu’a suivie Gauss quand il a créé la théorie des surfaces et montré la possibilité d’énoncer, sous une forme indépendante du système de coordonnées curvilignes employées pour repérer les points d’une surface, les lois de la géométrie des lignes tracées sur cette surface ou sur toutes les surfaces qui lui sont applicables. Gauss admet d’abord l’existence d’un plan tangent en tout point de la surface, c’est à dire le fait que dans une étendue infiniment petite autour d’un point quelconque les lois de la géométrie euclidienne du plan sont vérifiées. On peut donc mesurer la distance ds de deux points infiniment voisins par les opérations ordinaires du lever de plan et exprimer au voisinage de chaque point caractérisé par les coordonnées curvilignes u et v le carré ds^2 de la distance de deux points infiniment voisins dont les coordonnées diffèrent de du et dv par une expression de la forme

(9) ds^2 = E*du^2 + 2*F*du*dv + G*dv^2.

Les quantités E, F, G ont en chaque point des valeurs déterminées qui se déduisent d’opérations métriques (arpentage) faites au voisinage de ce point. Elles varient en fonction de u et v quand on parcourt l’ensemble de la surface. Les propriétés géométriques des lignes tracées sur la surface sont entièrement déterminées quand on connaît les trois quantités E, F, G en fonction de u et v, et s’expriment par des équations qui possèdent, grâce à l’introduction de ces trois fonctions et de leurs dérivées, des formes indépendantes du système de coordonnées curvilignes employé. En particulier, l’équation différentielle des géodésiques, qui jouent un rôle analogue à celui de la droite dans le plan, s’obtient en exprimant que ces lignes ont une longueur stationnaire entre deux points par la condition

(10) delta*sum(ds) = 0.

En outre, Gauss a montré qu’il existe en chaque point d’une surface une fonction des E, F, G et de leurs dérivées premières et secondes qui est un invariant absolu, qui prend la même valeur quel que soit le système de coordonnées employé. C’est la courbure totale, produit des deux courbures principales de la surface au point considéré. La géométrie sur la surface est euclidienne quand cette courbure totale est nulle en tout point (surfaces développables), elle est la géométrie non euclidienne de Riemann quand cette courbure a une valeur constante positive (sphère ou surfaces applicables sur la sphère) ou la géométrie non euclidienne de Lobatschewsky et Bolyai quand la courbure totale a une valeur négative constante. Voici le développement parallèle des idées dans la théorie de relativité généralisée :

Nous avons été conduits à admettre que l’énergie rayonnante est pesante, que la lumière ne se propage pas en ligne droite dans un champ de gravitation, pas plus qu’un mobile lancé ne s’y meut de manière rectiligne et uniforme. Or il est possible, au moins localement, de supprimer les effets de la gravitation en utilisant un système de référence en chute libre et sans rotation, le boulet de Jules Verne, par exemple, dans lequel tous les corps se meuvent par rapport aux parois d’un mouvement rectiligne et uniforme et par rapport auquel, par conséquent, il n’y a pas de champ de gravitation. Si nous admettons qu’en même temps la lumière s’y propage en ligne droite (par rapport à des axes liés au boulet), l’Univers est euclidien pour des observateurs en chute libre. Mais il ne l’est que dans une région infiniment petite : en effet, comme le champ de gravitation terrestre n’est pas uniforme, un mobile libre ne se meut d’un mouvement rectiligne et uniforme par rapport au boulet de Jules Verne que dans une région limitée au voisinage de celui-ci. L’univers euclidien lié à celui-ci est seulement langent à l’univers réel. Les mesures faites à son voisinage (analogues à l’arpentage dans le plan tangent) ne permettent d’évaluer le ds^2 entre deux événements par la formule (5) que dans un domaine d’univers infiniment petit. L’hypothèse de Gauss sur l’existence d’un plan tangent est analogue à la suivante :

En tout lieu et à tout instant (en tout événement), il y a un univers euclidien tangent à l’univers réel ; c’est celui d’observateurs liés à un système matériel en chute libre.

Réciproquement, si l’emploi d’un système de référence convenable permet de supprimer le champ de gravitation, au moins localement, l’emploi d’un système de référence quelconque est équivalent à l’introduction d’un champ de gravitation convenablement distribué (principe d’équivalence d’Einstein). En effet, si l’on suppose qu’on imprime au boulet de Jules Verne un mouvement de translation d’accélération quelconque, tout se passera pour les observateurs qui lui sont liés, à cause de la constance de g pour tous les corps, comme s’il était apparu un champ de gravitation uniforme d’intensité égale à l’accélération d’ensemble communiquée. De même, si le boulet est mis en rotation, les lois de la physique par rapport à des axes qui lui sont liés seront les mêmes que dans un champ de gravitation non uniforme distribué comme le champ d’accélération centrifuge. Sur la Terre, en particulier, les mesures faites au moyen du pendule donnent un champ de gravitation dont l’expérience seule ne permet pas de séparer les effets dus à la force centrifuge. Il est donc possible, et c’est là l’énoncé du principe de relativité généralisé, d’énoncer les lois de la Physique sous la même forme pour tous les systèmes de référence en mouvement quelconque, grâce à l’introduction de champs de gravitation convenablement distribués. La traduction analytique se fait comme en théorie des surfaces. L’emploi d’un système de référence quelconque (mollusque de M. Einstein) revient à caractériser ou repérer chaque événement par quatre coordonnées quelconques (x(1), x(2), x(3), x(4)) analogues aux u et v de Gauss. L’emploi du système de référence en chute libre permet en chaque événement (comme celui du plan tangent à une surface) d’évaluer le ds^2 entre deux événements infiniment voisins en fonction des dx(1), dx(2), dx(3), dx(4) sous la forme analogue à (9) :

(11) ds^2 = Sigma[g(i, k)*d(x(i))*d(x(k))]

les indices i et k prenant les valeurs 1, 2, 3 et 4. Les équations du mouvement d’un point libre défini toujours par la condition géodésique (6) s’expriment sous une forme indépendante du système de référence, grâce à l’introduction des g(i, k) analogues aux E, F, G de Gauss, et la forme de ces équations montre que les g(i, k) jouent un rôle analogue à celui du potentiel de gravitation dans la mécanique ordinaire ; on les appelle pour cette raison les potentiels de gravitation généralisés. Les propriétés cinématiques de l’univers sont caractérisées par les g(i, k), variables en général avec les x(i), comme les propriétés géométriques d’une surface sont caractérisées par les E, F, G. Le mouvement d’un point libre est une géodésique de cet univers, et le trajet d’un rayon lumineux est une géodésique de longueur nulle. Les lois de la Physique se trouvent étroitement déterminées par la condition de prendre une forme indépendante du système de référence, invariante ou covariante pour des changements quelconques de ce système. En particulier, M. Einstein a pu obtenir les équations qui déterminent la distribution du champ ou des potentiels de gravitation en fonction de la distribution de la matière et du rayonnement, c’est-à-dire de l’énergie présente. Ces équations doivent remplacer celles qui expriment la loi de gravitation de Newton et qui prennent, dans le vide, la forme de Laplace :

(12) Laplacien (phi) = 0,

et dans la matière la forme de Poisson :

(13) Laplacien (phi) = 4*Pi*G*rho,

où phi est le potentiel de gravitation au sens ordinaire, G la constante de la gravitation et rho la densité de la matière. En imposant aux équations cherchées, par analogie avec (12) et (13), la condition de ne faire intervenir que les g(i, k) avec leurs dérivées premières et secondes, et celle de conserver leur forme pour tous les changements de coordonnées, M. Einstein a pu résoudre le problème en utilisant l’existence d’un élément, analogue à la courbure totale de Gauss, et qui remplit les conditions imposées, élément connu sous le nom de tenseur de Riemann-Christoffel. Les équations ainsi obtenues pour déterminer la distribution du champ de gravitation généralisée ont pu être intégrées, approximativement par M. Einstein et complètement par M. Schwarzschild, dans le cas d’un centre matériel unique de masse M.

On obtient pour le ds^2 en coordonnées sphériques r, thêta, phi, l’expression

(14) ds^2 = [1-(2*G*M)/((V^2)*r)]*(dt^2) — (1/(V^2))*[(r^2)*((d(thêta))^2) + (r^2)*(sin^2(thêta))*((d(phi))^2) + (1 — (2*G*M)/((V^2)*r))^(-1)*(dr^2)]

Les géodésiques de cet univers s’obtiennent sans difficulté et correspondent, pour celles qui restent à distance finie, à un mouvement elliptique de Kepler avec rotation du périhélie d’une quantité par tour

delta(omega) = (3*G*M)/[(V^2)*a*(1-e^2)]

a étant le demi-grand axe et e l’excentricité de l’orbite elliptique.

Cette formule donne exactement le mouvement du périhélie de Mercure (43 secondes par siècle) quand on y donne à M la valeur de la masse du Soleil, à a et e les valeurs connues pour Mercure.

Le trajet d’un rayon lumineux étant une géodésique de longueur nulle, on obtient facilement une trajectoire incurvée vers le centre d’attraction avec une déviation totale entre les directions extrêmes

alpha = (4*G*M)/(R*(V^2))

R étant la distance minima du rayon au centre d’attraction. Pour une étoile vue au voisinage immédiat du bord du Soleil, cette formule donne la valeur (R étant pris égal au rayon du Soleil),

alpha = 1 ", 74,

exactement vérifiée par les mesures faites au cours de l’éclipse totale du 29 mai 1919. Enfin, pour des événements qui se passent en un même point à distance R du centre (dr = d(thêta) = d(phi) = 0 et r = R), la formule (14) donne

ds^2 = (1 — (2*G*M)/(R*(V^2))*(dt^2).

La même succession d’événements (vibration lumineuse d’un atome) se passant à grande distance du Soleil (sur la Terre, par exemple) on aurait le même ds^2 (si les deux successions se produisent sur un atome en chute libre dans les deux cas), mais un dt différent du précédent et donné par (R étant supposé infini)

ds^2 = (dt’)^2,

d’où

dt = (dt’)/[sqrt(1-(2*G*M)/(R*V^2))] = (dt’)*[1+(G*M)/(R*(V^2))]

en première approximation. Donc la période des vibrations lumineuses d’un même atome doit être plus longue à la surface du Soleil que sur la Terre, les raies spectrales du spectre solaire doivent être déplacées vers le rouge d’une quantité

(delta(lambda))/(lambda) = (G*M)/(R*(V^2)) = 2, 11.10^(-6),

par rapport aux raies correspondantes émises par une source terrestre, c’est-à-dire d’environ un millième d’unité Angström dans le jaune. Une Note, parue dans le journal anglais Nature du 29 janvier dernier, annonce de la part de M. Einstein que cette prévision vient d’être vérifiée expérimentalement. Cette prévision suppose d’ailleurs, ainsi qu’il résulte du raisonnement précédent, que les atomes ou molécules de la chromosphère, dans laquelle se produisent les raies d’absorption du spectre solaire, se comportent comme étant en chute libre pendant la plus grande partie du temps et ne soient pas déformées par la réaction nécessaire pour les maintenir en équilibre dans le champ de gravitation du Soleil. Cette condition est certainement remplie dans les régions élevées de la chromosphère.

  • Mise en page par Paul-Eric Langevin