Exposé élémentaire de la théorie d’Einstein et de sa généralisation/chap. 1

La bibliothèque libre.


PREMIÈRE PARTIE
LE PRINCIPE DE RELATIVITÉ RESTREINT

CHAPITRE PREMIER

LES NOTIONS ANCIENNES D’ESPACE ET DE TEMPS

L’analyse des conceptions anciennes d’espace et de temps, sur lesquelles sont fondées la géométrie et la mécanique rationnelle, nous conduira à l’expérience célèbre par laquelle Michelson avait pensé mettre en évidence le mouvement absolu de la terre dans l’espace.

J’admettrai que le lecteur possède les bases de la géométrie d’Euclide (lignes droites et lignes courbes, droites parallèles, droites perpendiculaires l’une sur l’autre, angles, etc.) ; ces bases sont d’ailleurs presque intuitives. Je rappellerai seulement ce qu’on entend par « système de coordonnées », en priant les lecteurs qui seraient peu familiarisés avec les mathématiques de ne pas s’effrayer de l’aridité du début de ce chapitre. Il suffit d’un peu de réflexion pour reconnaître qu’il s’agit de notions très simples, et ces notions sont indispensables pour la compréhension de la théorie d’Einstein.


Systèmes de coordonnées. — Supposons qu’une figure géométrique soit dessinée sur une feuille de papier plane. Si nous voulons préciser la forme de cette figure, il nous faut un moyen de repérer la position de chacun de ses points ; d’une façon générale,
Fig. 1.
l’étude des figures qu’on peut tracer sur un plan exige qu’on ait un moyen de désigner sans ambiguïté un point quelconque de ce plan : on y parvient à l’aide d’un système de coordonnées.

Nous pouvons, par exemple, marquer un point sur la feuille de papier et tracer, dans une direction d’ailleurs arbitrairement choisie, une droite passant par ce point (fig. 1). Joignons au point le point que nous voulons repérer, puis mesurons la distance et l’angle que forment les droites et  ; ces deux grandeurs, distance et angle sont dites « coordonnées du point  » ; elles déterminent entièrement la position de ce point car, le « pôle » et l’axe ayant été choisis une fois pour toutes, à chaque groupe de deux coordonnées correspond un point du plan et un seul. Ces coordonnées sont appelées coordonnées polaires.

Un autre système de coordonnées, dont nous ferons constamment usage, est celui des coordonnées cartésiennes rectangulaires. Par un point fixe , appelé origine des coordonnées, traçons deux droites rectangulaires , qui seront les axes de coordonnées (fig. 2). Nous pouvons repérer tout point du plan par sa position relativement à ces axes : en effet, du point abaissons, sur ces deux axes, deux perpendiculaires ; nous déterminons ainsi la projection  ; du point considéré sur l’axe , et sa projection sur l’axe  ; les distances , et , comptées sur chacun des axes à partir de l’origine (positivement dans un sens, négativement en sens opposé), sont les coordonnées cartésiennes du point . Prenons maintenant un second point de coordonnées
Fig. 2.
et , et proposons-nous d’exprimer la distance des deux points et en fonction de leurs coordonnées : d’après le théorème de Pythagore (le carré construit sur l’hypoténuse d’un triangle rectangle est égal à la somme des carrés construits sur les deux autres côtés), on a

ou, en désignant par la distance des deux points,

(1)

Dans ce système de coordonnées, le carré de la distance de deux points est égal à la somme des carrés des différences de leurs coordonnées.

La géométrie des figures tracées sur notre feuille de papier plane est à deux dimensions, puisque deux coordonnées (deux quantités variables d’un point à un autre) sont nécessaires et suffisantes pour déterminer la position d’un point du plan. Un plan est une « multiplicité bidimensionnelle »[1].

Passons maintenant à la géométrie des figures tracées, non plus seulement sur un plan, mais dans l’espace ; il nous faut introduire une troisième dimension :
Fig. 3.
à la longueur et à la largeur vient se joindre la hauteur.

Prenons dans l’espace un plan de référence (représenté en perspective sur la figure 3). Dans ce plan nous pouvons, comme précédemment, choisir un point origine et deux axes de coordonnées , . Soit un point quelconque de l’espace ; de ce point abaissons une perpendiculaire sur le plan  ; le point est entièrement défini par les coordonnées et de sa projection sur le plan, auxquelles il faut joindre sa distance au plan (considérée comme positive d’un côté du plan et comme négative du côté opposé). Le point a donc trois coordonnées , , (coordonnées cartésiennes rectangulaires) ; en d’autres termes, l’espace est une « multiplicité tridimensionnelle ».

La construction que nous venons de faire revient à la suivante : par un point de l’espace, choisi comme origine des coordonnées, nous faisons passer trois plans rectangulaires , , qui se coupent suivant les droites rectangulaires , , . Les distances , , , d’un point de l’espace aux trois plans , , choisis une fois pour toutes, sont les coordonnées cartésiennes de ce point.

Par une extension facile de la formule (1), le carré de la distance de deux points et de l’espace a pour expression, en fonction des coordonnées et de ces deux points

(2)

Un premier système de coordonnées ayant été choisi et tous les points de l’espace ayant été d’abord rapportés à ce système, nous pouvons changer de système en adoptant ensuite un second système Supposons que ce second système soit immobile par rapport au premier. Six quantités sont nécessaires et suffisantes pour définir la position relative des deux systèmes d’axes : ce sont trois longueurs (les coordonnées de l’origine du second système prises dans le premier système) qui déterminent la position relative des deux origines et , et trois angles qui définissent l’orientation relative des axes des deux systèmes. En géométrie analytique, on établit les formules qui permettent, connaissant ces six quantités, de passer d’un des systèmes à l’autre, c’est-à-dire d’exprimer les coordonnées nouvelles , , d’un point en fonction des coordonnées anciennes du même point (et inversement).

Tous les systèmes de coordonnées (en nombre infini) immobiles les uns par rapport aux autres, constituent, à vrai dire, un seul et même système de référence (terme à retenir pour la suite), car on peut les supposer tous liés à un même corps de référence rigide. Par exemple, pour les phénomènes terrestres, il est naturel de prendre la terre comme corps de référence et d’adopter un système quelconque de coordonnées lié à la terre[2].


Le groupe de transformations de Galilée. — Supposons maintenant que, connaissant les coordonnées d’un point dans un premier système de coordonnées , on demande les coordonnées du même point de l’espace dans un second système en mouvement par rapport au premier système.

Ici s’introduit une notion nouvelle : mouvement signifie changement de position, et ce changement implique la notion de « temps ».

Considérons un système en mouvement rectiligne et uniforme par rapport au système c’est-à-dire se mouvant comme un ensemble rigide, par rapport à en ligne droite et avec une vitesse constante . Pour n’envisager que le cas le plus simple, nous supposerons que les axes des et des sont confondus et parallèles à la direction de la vitesse (fig. 4), que les axes des et des
Fig. 4
, des et des sont parallèles, et qu’on compte le temps à partir du moment où les deux origines et sont en coïncidence. Les formules de transformation sont évidentes : pendant le temps , le point s’est déplacé, à partir du point , de la longueur (par définition même de la vitesse qui est égale au quotient du trajet parcouru par le temps employé à le parcourir) ; donc, à l’époque , la coordonnée d’un point, quel qu’il soit, est inférieure à la coordonnée du même point dans le système , de la longueur parcourue par c’est-à-dire de  ; d’autre part les et les restent constamment égaux aux et aux  ; on a donc (avec cette disposition particulière des axes des deux systèmes et )

(3)

Ce sont les formules de transformation qui permettent de passer du système au système . Ces trois relations définissent une transformation dépendant d’un seul paramètre, la vitesse , et toutes les transformations de ce genre correspondant à toutes les valeurs de constituent un groupe, c’est-à-dire que deux transformations successives de vitesses et équivalent à une transformation unique de même forme ; on a d’ailleurs pour cette transformation unique une vitesse .

Ce groupe porte le nom de groupe de Galilée. Il constitue la base de la cinématique classique.


Les invariants fondamentaux dans l’ancienne conception de l’univers. — La géométrie est la science des formes dans l’espace ; elle ne s’occupe pas du temps ; cependant, la notion d’espace et la notion de temps interviennent à la fois dans toutes nos observations, car celles-ci sont déterminées, non pas uniquement par des positions ou des formes dans l’espace, mais par le fait qu’il se passe quelque chose en un certain lieu à une certaine époque ; nos observations sont donc déterminées par des événements. Tout événement possède quatre coordonnées : trois coordonnées d’espace qui fixent le lieu où il s’est produit (par rapport à un corps de référence) et une coordonnée de temps (la durée écoulée à partir d’un événement origine jusqu’à l’époque où s’est produit l’événement considéré).

Les constatations d’événements nous conduisent à des relations entre diverses grandeurs mesurées par les observateurs ; ces relations sont les lois de la physique. Il est évident que ces lois ne peuvent avoir une réalité objective que si elles sont indépendantes de l’observateur, que si elles peuvent s’exprimer sous une forme indépendante de tout système de référence. Notre premier souci doit être de rechercher quels sont les éléments invariants, c’est-à-dire les grandeurs indépendantes de tout système de coordonnées ; nous allons montrer que, dans l’ancienne conception de l’univers, il existait deux invariants fondamentaux : l’intervalle de temps écoulé entre deux événements, et la forme des figures géométriques.

LE TEMPS ABSOLU. — Dans les idées anciennes on admet que le temps est un invariant : c’est l’hypothèse du temps universel et absolu. Il est intéressant de chercher quelle doit être l’origine de ce postulat. Imaginons un certain nombre de systèmes de référence en mouvement les uns par rapport aux autres ; dans chaque système se trouve un observateur, immobile par rapport à son système.

Deux événements et se produisent : pour l’observateur d’un des systèmes, est antérieur à . Pourquoi s’est-on cru obligé d’admettre que est nécessairement antérieur à pour tous les autres observateurs, c’est-à-dire qu’on ne peut, dans aucun cas, par un changement convenable du système de référence, inverser l’ordre de succession de deux événements ?

Cela tient à ce qu’on suppose implicitement que, puisque s’est montré antérieur à pour un des observateurs, il a pu être la cause de , ou tout au moins qu’il aurait pu influencer . Comme il serait absurde de supposer que, pour d’autres observateurs, l’effet puisse être antérieur à sa cause, on est conduit à penser que l’ordre de succession de deux événements est toujours bien déterminé, qu’il est le même dans tous les systèmes.

Demandons-nous maintenant pourquoi on admet que a toujours pu être prévenu de  : c’est parce qu’on suppose la possibilité d’une influence pouvant se propager instantanément. Or cette possibilité, non seulement est compatible avec la mécanique ancienne, mais est exigée par cette mécanique où l’on admet la conception du solide parfait : avec une tige rigide, on aurait pu signaler instantanément la production du premier événement au point où le second va se produire, et influencer ce second événement.

La notion de possibilité d’une propagation instantanée entraîne celle de simultanéité absolue : deux événements simultanés dans un système de référence sont simultanés dans tous les autres. Il résulte de là que, pour des événements non simultanés, la durée qui sépare deux événements et est la même pour tous les observateurs en mouvement les uns par rapport aux autres : considérons, en effet, deux systèmes et dans chacun desquels les observateurs ont des horloges identiques. Prenons comme événement origine du temps dans chacun des systèmes ; se produit à l’époque du système et à l’époque du système  : la simultanéité étant absolue, les indications et des deux horloges constituent deux événements simultanés, non-seulement pour les observateurs des systèmes et , mais pour tout observateur : cela signifie que les heures marquées sont les mêmes pour tous les observateurs : l’intervalle de temps séparant et est absolu.

On voit que les notions de solide parfait (corps rigide), de propagation instantanée, de simultanéité absolue, de durée absolue s’unissent et s’adaptent complètement les unes aux autres. Qu’une de ces notions vienne à être renversée, tout l’échafaudage s’écroulera.

L’ESPACE ABSOLU. — La notion d’espace absolu dérive aussi de l’idée du solide parfait, ou encore de l’invariance de forme des figures géométriques.

Nous avons dit plus haut que la géométrie ne s’occupe pas du temps ; en termes plus précis, nous pouvons dire qu’elle envisage seulement des événements simultanés, car la forme d’un objet est l’ensemble des positions simultanées de tous ses points (définition de M. P. Langevin). Si l’on admet que la simultanéité est absolue, une figure géométrique a une forme absolue, indépendante de l’état de mouvement du système de référence : par exemple un corps qui a la forme d’une sphère pour un observateur doit, d’après les idées anciennes, être encore une sphère pour tout observateur en mouvement par rapport au premier.

Nous trouvons alors un invariant fondamental de l’espace dans la distance spatiale de deux événements, à condition toutefois que ces événements soient simultanés (appendice, note 1).

D’autres invariants sont d’ailleurs envisagés en géométrie : ce sont les angles, surfaces, volumes.

Les équations qui expriment les lois de la géométrie sont sous la forme requise pour que ces lois soient objectives, car elles ne changent pas de forme par application des formules de transformation de coordonnées quand on passe d’un système de coordonnées à un autre.

Cette invariance de forme correspond à une réalité indépendante de tout système de référence : l’espace de la géométrie euclidienne, l’espace absolu.

Lorsque deux événements ne sont pas simultanés, leur distance spatiale cesse d’être un invariant : elle dépend du système de référence. Par exemple : un observateur quitte un lieu dans un véhicule qui le transporte dans un lieu Le départ de et l’arrivée en sont deux événements ; quelle est leur distance dans l’espace ? Cela dépend du système de référence : dans un système lié à la terre, cette distance est la distance des deux points de la terre et  ; dans un système de coordonnées lié à l’observateur, la distance est nulle, puisque les points de ce système où se sont passés les événements sont en coïncidence.

Ainsi, la distance de deux événements non simultanés est relative au système de référence. Sans doute, s’il y a un espace absolu, il doit y avoir une distance absolue dans cet espace, mais l’observateur ne peut pas la connaître parce que, ignorant son propre mouvement dans l’espace absolu, il ne peut pas tenir compte du trajet qu’il a parcouru pendant le temps écoulé entre les deux événements.

Voilà un résultat étrange et peu satisfaisant pour l’esprit : la cinématique classique fait envisager une dissymétrie entre les propriétés de l’espace et celles du temps : l’espace que nous percevons serait absolu pour les événements simultanés, relatif pour des événements non simultanés, alors que le temps serait toujours absolu.

Cette dissymétrie disparaîtra dans l’espace-temps de la théorie nouvelle.


Les bases de la dynamique newtonienne. — La dynamique introduit deux notions nouvelles, celle de force et celle de masse.

Tout d’abord, il existe, dans l’ancienne mécanique, une loi fondamentale appelée loi d’inertie de Galilée : tout corps sur lequel n’est appliquée aucune force reste au repos ou se meut dans l’espace d’un mouvement rectiligne et uniforme.

Autrement dit : la matière conserve d’elle-même le mouvement acquis, tant qu’aucune influence, appelée force, ne l’oblige à modifier son mouvement. L’inertie est cette tendance de la matière à garder son état de mouvement.

Lorsqu’une force est appliquée sur un corps, le mouvement de celui-ci devient accéléré. On appelle accélération l’accroissement (positif ou négatif) de la vitesse dans l’unité de temps. Si la force agit constamment dans la direction de la vitesse acquise, la trajectoire reste rectiligne, la direction de la vitesse n’est pas modifiée mais sa grandeur est changée (accélération tangentielle) ; si, à chaque instant, la force agit dans une direction perpendiculaire à la trajectoire (normalement à la trajectoire), la vitesse reste constante en grandeur mais sa direction est constamment modifiée par la force (accélération normale) ; si la force est oblique sur la trajectoire, il y a à la fois changement de grandeur et changement de direction de la vitesse.

Ainsi, une force produit une accélération dans la direction où elle agit ; le rapport entre la grandeur de la force agissante et la grandeur de l’accélération prise par un corps sous l’action de cette force est, par définition, la masse de ce corps[3].

Dans la dynamique newtonienne, la masse d’une portion de matière est, à priori, considérée comme rigoureusement constante, indépendante des changements d’état que la portion de matière peut subir, indépendante de la vitesse : c’est un invariant qui a même valeur dans tous les systèmes de référence et qui caractérise une quantité déterminée de matière.

La force est une grandeur dirigée, un vecteur ; l’accélération est aussi un vecteur qui, d’après ce qui précède, est dirigé suivant la direction de la force ; la masse est une grandeur qui n’a pas de direction, un scalaire.

On démontre que les équations fondamentales de la dynamique conservent leur forme quand on passe d’un système de référence à un autre système en mouvement rectiligne et uniforme par rapport au premier (appendice, note 2). On peut les résumer par la relation vectorielle, indépendante de tout système de coordonnées

(4)

et étant les vecteurs force et accélération, et désignant la masse de la portion de matière considérée.

L’invariance des lois de la mécanique permet d’en donner des énoncés intrinsèques, de même que les invariants de la géométrie (distances, angles, etc.) permettent d’énoncer les théorèmes sans faire intervenir des axes de coordonnées.


Le principe de relativité de la mécanique newtonienne. — Puisque les lois de la mécanique sont les mêmes dans tous les systèmes en mouvement de translation uniforme, il est impossible, par des expériences mécaniques faites à l’intérieur d’un système clos, de mettre en évidence un mouvement de translation uniforme de ce système.

Le mouvement de translation uniforme n’a donc pas un caractère absolu ; on ne peut parler de translation uniforme que relativement à un corps de référence considéré, par convention, comme au repos.

Ce principe de relativité est conforme à l’expérience.

Par contre, il est essentiel de remarquer que toute accélération a un caractère absolu et peut être mise en évidence par des expériences intérieures à un système ; l’état d’accélération d’un système se manifeste, à l’intérieur de ce système, par l’existence d’une force qui, en tout point du système, agit sur une masse matérielle proportionnellement à cette masse ; on dit alors que dans un système accéléré, il règne un champ de force d’inertie. Voici un exemple bien connu : la rotation de la terre autour de la ligne des pôles est un mouvement accéléré (tout mouvement qui n’est pas à la fois rectiligne et uniforme est accéléré ; ici le mouvement est uniforme, puisque la vitesse de rotation de la terre est constante, mais il n’est pas rectiligne). Il règne alors, en tout point de la terre, un champ de forces centrifuges : la verticale n’a pas rigoureusement la même direction que si la terre était immobile ; tout projectile est soumis à une force (appelée force centrifuge composée) qui dévie sa trajectoire ; la même force dévie les vents (vents alizés, vents contre-alizés) dans la circulation générale de l’atmosphère : c’est elle enfin qui a été mise en évidence par l’expérience célèbre du pendule de Foucault. Si la terre avait été perpétuellement couverte d’un manteau de nuages, empêchant de constater sa rotation par l’observation du mouvement apparent des étoiles, on aurait cependant mesuré cette rotation avec le pendule de Foucault.


  1. Il en est de même, d’ailleurs, d’une surface courbe, mais la géométrie des surfaces courbes n’est plus la géométrie d’Euclide. Nous reviendrons plus tard sur cette question.
  2. Il est vrai que la terre, dont l’écorce présente des marées, n’est pas un corps rigide, mais précisément on évalue les oscillations de l’écorce terrestre en les rapportant à un corps de référence fictif supposé rigide, le géoïde.
  3. Il faut bien se garder de confondre la masse et le poids. Le poids d’un corps est la force qui agit sur lui dans le champ de gravitation de la terre ; il faut diviser le poids par l’accélération due à la pesanteur pour obtenir la masse.

    En un même lieu, tous les objets tombent avec la même vitesse (dans le vide, sinon la résistance de l’air les ralentirait inégalement) ; cela signifie que l’accélération due à la pesanteur est la même pour tous les corps ; à Paris, elle est égale à 981 en unités C. G. S., c’est-à-dire que pendant chaque seconde, la vitesse déjà acquise par un corps qui tombe s’accroît d’une vitesse supplémentaire égale à 981 centimètres par seconde. L’accélération étant la même pour tous les corps, il y a en un même lieu proportionnalité exacte entre les masses et les poids.

    Mais comme la terre n’est pas rigoureusement sphérique, le poids d’un corps n’est pas le même partout ; il est un peu plus grand aux pôles qu’à l’équateur ; cependant la masse reste constante. Sur la lune, les poids des objets seraient beaucoup plus petits que sur la terre, mais les masses seraient les mêmes.