Théorie du mouvement des corps célestes/L2S3
(p. 264-290).
À UN NOMBRE QUELCONQUE D’OBSERVATIONS.
Si les observations astronomiques et les autres quantités, sur lesquelles s’appuie le calcul des orbites, jouissaient d’une précision absolue, les éléments aussi, qu’ils soient basés sur trois ou sur quatre observations, s’obtiendraient aussitôt absolument exacts (en tant que le mouvement soit à la vérité supposé rigoureusement soumis aux lois de Képler), et, par suite, pourraient être confirmés par d’autres observations, mais non corrigés. Mais puisque toutes nos mesures et nos observations ne sont que des approximations de la vérité, et qu’il doit en être de même de tous les calculs qui reposent sur ces quantités, il faudra viser à ce but important que tous les calculs relatifs au phénomène concret s’approchent autant que faire se peut de la vérité. Mais ceci ne peut avoir lieu autrement que par une combinaison convenable d’un plus grand nombre d’observations que celui qui est rigoureusement nécessaire pour la détermination des quantités inconnues. On ne peut donc entreprendre enfin ce travail que lorsqu’on a déjà obtenu une connaissance approchée de l’orbite, qui doit après cela être corrigée de manière à satisfaire le plus exactement possible à toutes les observations. Quoique cette expression paraisse impliquer quelque chose de vague, cependant nous donnons ci-dessous les principes suivant lesquels le problème est soumis à une solution légitime et méthodique.
Il ne peut être avantageux de viser à la plus grande précision, que lorsque la dernière main doit être mise à l’orbite que l’on veut déterminer ; au contraire, tant qu’on aura l’espoir que de nouvelles observations donneront bientôt lieu à de nouvelles corrections, il sera convenable de se relâcher plus ou moins, suivant le cas, d’une extrême précision, si l’on peut de cette manière diminuer notablement la longueur des calculs. Nous nous attacherons à considérer l’un et l’autre cas.
Il est d’abord de la plus grande importance que chacune des positions géocentriques du corps céleste sur lesquelles on se propose de baser l’orbite, ne soit pas déduite de simples observations, mais, si c’est possible, de plusieurs observations combinées de telle sorte que les erreurs accidentelles se détruisent mutuellement, autant que faire se peut. C’est-à-dire, que les observations qui ne sont distantes l’une de l’autre que d’un intervalle de peu de jours, — ou même, suivant le cas, d’un intervalle de 15 ou 20 jours, — ne devront pas être employées dans le calcul comme autant de positions différentes ; mais il sera préférable d’en déduire une position unique, qui est une sorte de moyenne entre elles toutes, et qui admet alors une bien plus grande précision que chaque observation considérée séparément. Ce travail repose sur les principes suivants :
Les positions géocentriques de l’astre calculées à l’aide des éléments approchés doivent différer peu des véritables positions, et les différences entre les premières et les dernières doivent varier si lentement que, pendant un intervalle de temps de peu de jours, on peut les considérer comme à peu près constantes, ou, au moins, les variations peuvent être considérées comme proportionnelles au temps. Si donc, les observations étaient exemptes de toute erreur, les différences entre les lieux observés correspondant aux époques etc., et ceux qui ont été calculés d’après les éléments, c’est-à-dire, les différences entre les longitudes et les latitudes observées et calculées, ou les ascensions droites et les déclinaisons, seraient des quantités sensiblement égales, ou au moins croissantes ou décroissantes uniformément et très-lentement. Soient, par exemple, etc., les ascensions droites observées qui correspondent à ces époques, et soient etc., les ascensions droites calculées ; alors, les différences etc., différeront des véritables déviations des éléments en tant seulement que les observations elles-mêmes sont erronées. Si donc ces déviations peuvent être considérées comme constantes pour toutes ces observations, les quantités etc., fourniront autant de déterminations différentes de la même quantité, pour la valeur exacte de laquelle il sera convenable de prendre la moyenne arithmétique entre ces déterminations, en tant qu’il n’y ait réellement aucune raison de préférer l’une à l’autre. Mais si l’on trouve que l’on ne peut pas attribuer le même degré de précision à chaque observation, supposons que le degré de précision, dans chacune d’elles, soit considéré comme respectivement proportionnel aux nombres etc., c’est-à-dire, que des erreurs réciproquement proportionnelles à ces nombres aient pu être commises dans les observations avec une égale facilité ; alors, d’après les principes donnés plus bas, la valeur moyenne la plus probable ne sera plus la simple moyenne arithmétique, mais
En posant maintenant, cette valeur moyenne égale à on pourra prendre respectivement pour les ascensions droites vraies, et alors il sera arbitraire, laquelle nous emploierons dans le calcul. Mais si les observations sont distantes l’une de l’autre d’un trop grand intervalle de temps, ou si les éléments de l’orbite ne sont pas encore connus d’une manière suffisamment approchée, de manière qu’il ne soit plus permis de considérer leurs déviations comme constantes pour toutes les observations, on s’apercevra facilement, qu’il n’en résultera aucune modification, si ce n’est que la déviation moyenne ainsi trouvée ne peut pas être regardée comme commune à toutes les observations, mais doit plutôt se rapporter à quelque époque intermédiaire, qui doit être déduite des époques individuelles de la même manière que s’obtient des déviations correspondantes, et par conséquent généralement à l’époque
C’est pourquoi, s’il plaît de rechercher une grande précision, il faudra calculer, d’après les éléments, la position géocentrique pour la même époque, et ensuite la corriger de l’erreur moyenne pour que la position soit obtenue avec le plus d’exactitude ; le plus souvent cependant il suffira largement de rapporter l’erreur moyenne à l’observation la plus voisine de l’époque moyenne. Ce que nous avons dit ici des ascensions droites s’applique également aux déclinaisons, ou, si on le désire, aux longitudes et aux latitudes ; cependant il sera toujours préférable de comparer immédiatement les ascensions droites et les déclinaisons calculées, à l’aide des éléments, avec celles observées : par là, en effet, non-seulement nous rendrons le calcul plus court, particulièrement si nous employons les méthodes enseignées dans les art. 53-60, mais cette méthode se recommandera en outre par cet avantage, que l’on peut aussi faire usage des observations incomplètes ; et, qu’aussi, il serait à craindre, si tout était rapporté aux longitudes et latitudes, qu’une observation bien effectuée en ascension droite, mais mal en déclinaison (ou vice versa), ne fût défigurée des deux côtés, et ne devienne ainsi entièrement inutile. Enfin, le degré de la précision devant être attribuée à la moyenne obtenue ci-dessus, sera, d’après les principes qui seront bientôt expliqués,
de manière que quatre ou neuf observations, également exactes, seront demandées, si la moyenne doit jouir d’une précision double ou triple, et ainsi de suite.
Si l’orbite d’un corps céleste a été déterminée selon les méthodes enseignées dans les sections précédentes, d’après trois ou quatre positions géocentriques telles que chacune d’elles ait été déduite, d’après la règle de l’article précédent, d’un grand nombre d’observations, cette orbite tiendra comme le milieu entre toutes ces observations, et il ne restera dans les différences entre les lieux observés et calculés aucune trace d’ordre qu’il soit possible de faire disparaître ou de diminuer sensiblement par une correction des éléments. Maintenant, toutes les fois que l’ensemble de toutes les observations n’embrasse pas un trop grand intervalle de temps, on pourra obtenir de cette manière l’accord si désiré des éléments avec toutes les observations, pourvu que les trois ou quatre positions normales soient judicieusement choisies. Pour déterminer les orbites des comètes ou des planètes nouvelles, dont les observations n’embrassent pas encore une année, nous réussirons le plus souvent par ce procédé, autant que le permet la nature du cas. Toutes les fois donc, qu’une orbite devant être déterminée, est inclinée sur l’écliptique d’un angle considérable, elle sera, en général, établie sur trois observations que nous choisirons aussi écartées que possible ; mais, si en agissant ainsi, nous tombions fortuitement sur l’un des cas exclus ci-dessus (art. 160-162), ou si l’inclinaison de l’orbite semble trop petite, nous préférerons la détermination par quatre positions que nous prendrons aussi, le plus distantes l’une de l’autre.
Mais quand on possède déjà une plus longue série d’observations embrassant plusieurs années, on peut en déduire plusieurs positions normales ; c’est pourquoi, nous n’assurerions pas la plus grande précision, si, pour la détermination de l’orbite, nous choisissions seulement trois ou quatre positions, en négligeant toutes les autres. Dans un pareil cas, au contraire, si nous nous proposons d’atteindre la plus grande exactitude, nous ferons en sorte de recueillir le plus grand nombre possible de bonnes positions, et nous en ferons usage. Nous aurons donc alors plus de données qu’il n’en faut pour la détermination des quantités inconnues ; mais toutes ces données seront sujettes à des erreurs, petites toutefois, de manière qu’il sera généralement impossible de satisfaire à toutes exactement. Maintenant, comme il n’y a pas de raison pour que, parmi ces données, nous en considérions six quelconques comme parfaitement exactes, que plutôt, suivant toutes les probabilités, nous devons supposer que des erreurs plus ou moins grandes sont également possibles dans toutes indistinctement ; puisque en outre, généralement parlant, les petites erreurs sont plus souvent commises que les grandes, il est évident qu’une orbite qui, tandis qu’elle satisfait exactement aux six données, s’écarte plus ou moins des autres, doit, d’après les principes du calcul des probabilités, être considérée comme moins exacte qu’une autre qui, tout en différant aussi légèrement avec ces six données, présente un accord d’autant meilleur avec les autres. La recherche d’une orbite ayant, dans un sens rigoureux, la plus grande probabilité, dépendra de la connaissance de la loi suivant laquelle la probabilité des erreurs diminue quand les erreurs augmentent ; mais ceci dépend de tant de considérations vagues et douteuses, — physiologiques aussi, — qui ne peuvent être soumises au calcul, qu’il est à peine, et même moins qu’à peine, possible d’assigner convenablement une loi de ce genre dans aucun cas d’astronomie pratique. Néanmoins, la recherche de la liaison entre cette loi et l’orbite la plus probable, que nous entreprendrons maintenant dans sa plus grande généralité, ne doit en aucune façon être considérée comme une stérile spéculation.
Dans ce but, de notre problème spécial nous nous élèverons à une recherche beaucoup plus générale et des plus fécondes dans toute application du calcul à la philosophie naturelle. Soient des fonctions des quantités inconnues etc, le nombre de ces fonctions, le nombre des inconnues, et supposons que par des observations directes on ait trouvé pour valeurs de ces fonctions etc. En parlant d’une manière générale, la détermination des valeurs des inconnues constituera donc un problème indéterminé, déterminé ou plus que déterminé, selon que l’on aura ou [1].
Nous nous occuperons ici du dernier cas seulement, dans lequel, évidemment, la représentation exacte de toutes les observations serait seulement possible, dans le cas où toutes les observations seraient absolument exemptes d’erreur. Puisque par la nature des choses ceci ne peut avoir lieu, on devra regarder comme possible tout système de valeurs des quantités inconnues etc., par lequel s’obtiendront les valeurs des fonctions etc., renfermées dans les limites des erreurs qui peuvent être commises dans les observations, ce qui, cependant, ne doit nullement être compris comme impliquant que chacun de ces systèmes possibles doit jouir d’un égal degré de probabilité.
Supposons d’abord, dans toutes les observations, un état de choses tel qu’il n’y ait aucune raison pour supposer l’une moins exacte que l’autre, ou tel qu’on doive supposer des erreurs de même grandeur comme également probables dans chaque observation. La probabilité devant être attribuée à toute erreur sera donc exprimée par une fonction de que nous désignerons par Maintenant, quoiqu’il ne soit pas permis d’assigner d’une manière précise la forme de cette fonction, nous pouvons au moins affirmer que sa valeur doit devenir maximum pour avoir généralement la même valeur pour des valeurs de égales et de signes contraires, et enfin, s’évanouir si l’on prend pour l’erreur maximum ou une valeur plus grande, doit donc particulièrement se rapporter à la classe des fonctions discontinues, et si nous nous permettons, pour nos besoins pratiques, de lui substituer quelque fonction analytique, celle-ci devra être établie de telle sorte que pour des valeurs de de part et d’autre de zéro, elle converge asymptotiquement vers zéro, de façon qu’au delà de cette limite elle puisse être considérée comme véritablement nulle. De plus, la probabilité que l’erreur doit tomber entre les limites et distantes l’une de l’autre de la différence infiniment petite sera exprimée par par conséquent, la probabilité, en général, que l’erreur tombera entre et sera exprimée par l’intégrale considérée depuis jusqu’à Cette intégrale prise depuis la plus grande valeur négative de jusqu’à sa plus grande valeur positive, ou, plus généralement, depuis jusqu’à doit nécessairement être égale à l’unité.
En supposant donc qu’il existe quelque système déterminé de valeurs des quantités etc., la probabilité que l’observation donnera pour la valeur sera exprimée par les valeurs de etc., étant substituées dans de la même manière, etc., exprimeront les probabilités que les observations doivent fournir les valeurs etc., des fonctions etc. C’est pourquoi, puisqu’il est permis de considérer toutes les observations comme des événements indépendants les uns des autres, le produit
exprimera l’attente ou la probabilité que toutes ces valeurs résulteront en même temps des observations.
Maintenant, de même que lorsque des valeurs déterminées quelconques des inconnues sont adoptées, une probabilité déterminée correspond, avant l’observation effectuée, à un système quelconque de valeurs des fonctions etc., de même, réciproquement, après que les observations auront fourni des valeurs déterminées des fonctions, une probabilité déterminée appartiendra à chaque système de valeurs des inconnues, dont les valeurs des fonctions auraient pu découler ; il est en effet évident, que les systèmes dans lesquels il avait existé la plus grande attente de l’événement qui se produit, devront être considérés comme les plus probables. L’estimation de cette probabilité repose sur le théorème suivant :
Si, en faisant une hypothèse quelconque la probabilité de quelque événement déterminé est mais qu’en faisant une autre hypothèse exclusive de la première, et par soi-même également probable, la probabilité de l’événement soit je dis alors, que quand l’événement arrivera en effet, la probabilité que soit la véritable hypothèse, est à la probabilité que soit la vraie, comme est à
Pour le démontrer, supposons que, pour distinguer toutes les circonstances dont dépendra, avec ou quelque autre hypothèse, que l’événement ou un autre doive se produire, nous formions un système des différents cas qui, par eux-mêmes, peuvent être considérés comme également probables (c’est-à-dire, tant qu’il est incertain que l’événement ou un autre se produira), et que ces cas soient ainsi distribués,
Que parmi eux il s’en trouve |
dans lesquels on doit avoir l’hypothèse |
pour que d’après ces modifications, il se produise l’événement |
différent de | ||
différent de | ||
différente de et | ||
différente de et | différent de |
On aura alors
de plus, avant que l’événement fût connu la probabilité de l’hypothèse était
mais après que l’événement aura été connu, quand les cas disparaissent du nombre des cas possibles, la probabilité de la même hypothèse sera
de la même manière, la probabilité de l’hypothèse avant et après l’événement, sera respectivement exprimée par
par conséquent, puisqu’on a supposé, avant l’événement connu, la même probabilité aux hypothèses et on aura
d’où l’on conclut immédiatement la vérité du théorème.
Maintenant, puisque nous supposons qu’en dehors des observations on n’a aucune autre donnée pour la détermination des quantités inconnues, et, par suite, que tous les systèmes de valeurs de ces inconnues étaient également probables avant les observations, la probabilité d’un système quelconque établi après ces observations sera proportionnelle à On doit comprendre que ceci veut dire que la probabilité que les valeurs des inconnues tombent, respectivement, entre les limites infiniment voisines et et et et etc., est exprimée par
où sera une quantité constante indépendante de etc. ; et sera évidemment, la valeur de l’intégrale multiple d’ordre
s’étendant, pour chaque variable etc., depuis la valeur jusqu’à la valeur
Il suit immédiatement de là, que le système le plus probable de valeurs des quantités doit être celui dans lequel obtient une valeur maximum, et, par suite, qui découle des équations
En posant,
et
ces équations prennent la forme suivante :
De là, par conséquent, on peut obtenir, par élimination, une solution complètement déterminée du problème, aussitôt qu’on connaît la nature de la fonction Puisque nous ne pouvons définir cette fonction a priori, nous chercherons, en envisageant la question sous un autre point de vue, sur quelle fonction, tacitement acceptée pour base, peut convenablement s’appuyer un principe vulgaire dont l’excellence est généralement reconnue. On regarde en effet comme un axiome, l’hypothèse que si une quantité a été déterminée par plusieurs observations immédiates, effectuées dans les mêmes circonstances et avec un même soin, la moyenne arithmétique entre toutes les valeurs observées donne la valeur la plus probable de cette quantité, sinon en toute rigueur, au moins cependant d’une manière très-approchée, de telle sorte que le plus sûr est toujours de s’y tenir.
En posant donc
on devra généralement avoir
si à on substitue la valeur
quelle que soit la valeur entière positive que exprime.
En supposant donc
on aura généralement, c’est-à-dire pour toute valeur entière positive de
d’où l’on déduit facilement que doit être une quantité constante, que nous désignerons par De là nous avons
ou
en désignant par la base des logarithmes hyperboliques, et en supposant la constante égale à
De plus, on voit facilement que doit nécessairement être négatif pour que puisse réellement devenir maximum ; posons donc
et puisque, par un élégant théorème découvert par l’illustre Laplace, l’intégrale
prise depuis jusqu’à est (en désignant par la demi-circonférence du cercle dont le rayon est l’unité), notre fonction devient
La fonction que nous venons de trouver ne peut certainement exprimer, en toute rigueur, les probabilités des erreurs : puisque, en effet, les erreurs possibles sont dans tous les cas renfermées entre certaines limites, la probabilité d’erreurs dépassant ces limites devrait toujours être égale à zéro, tandis que notre formule donne toujours une valeur finie. Cependant, ce défaut, que doit, par sa nature, présenter toute fonction analytique, n’est d’aucune importance dans la pratique, parce que la valeur de notre fonction décroît si rapidement, dès que atteint une valeur considérable, qu’elle peut sûrement être considérée comme équivalente à zéro. En outre, la nature du sujet ne permettra jamais d’assigner avec une rigueur absolue les limites mêmes des erreurs.
Enfin, la constante pourra être considérée comme une mesure de la précision des observations. Si, en effet, la probabilité de l’erreur dans un système quelconque d’observations, est supposée devoir être exprimée par
et dans un autre système d’observations plus ou moins exactes, par
la probabilité, que dans une observation quelconque du premier système, l’erreur soit contenue entre les limites et sera exprimée par l’intégrale
prise depuis jusqu’à et de la même manière, la probabilité que l’erreur d’une observation quelconque dans le second système, ne dépasse pas les limites et sera exprimée par l’intégrale
prise depuis jusqu’à mais il est évident que ces deux intégrales deviennent égales toutes les fois qu’on a Si donc on a, par exemple, une erreur double pourra être commise dans le premier système aussi facilement qu’une erreur simple dans le second ; dans ce cas on attribue, selon la manière ordinaire de parler, une précision double aux dernières observations.
Nous développerons maintenant les conséquences de cette loi. Il est évident que pour que le produit
devienne maximum, la somme doit devenir minimum. C’est pourquoi, le système le plus probable des valeurs des inconnues sera celui dans lequel la somme des carrés des différences entre les valeurs observées et calculées des fonctions est un minimum, pourvu qu’on suppose dans toutes les observations le même degré de précision. Ce principe, qui promet d’être d’un usage très-fréquent dans toutes les applications des mathématiques à la philosophie naturelle, doit être considéré comme un axiome, du même droit que la moyenne arithmétique entre plusieurs valeurs observées d’une même quantité est adoptée comme la valeur la plus probable.
On peut maintenant étendre sans peine ce principe aux observations d’une précision inégale. Si, par exemple, la mesure de la précision des observations par lesquelles on a trouvé est respectivement exprimée par c’est-à-dire, si l’on suppose que les erreurs que l’on a pu commettre avec la même facilité, dans ces observations, sont réciproquement proportionnelles à ces quantités, ceci sera évidemment la même chose que si, par des observations d’une précision égale (dont la mesure ), les valeurs des fonctions etc., avaient été directement trouvées égales à etc. ; c’est pourquoi, le système le plus probable de valeurs des quantités etc., sera celui dans lequel la somme etc., c’est-à-dire dans lequel la somme des carrés des différences entre les valeurs actuellement observées et calculées, multipliées par les carrés des nombres qui marquent le degré de précision, est minimum. De cette manière, il n’est même pas nécessaire que les fonctions se rapportent à des quantités homogènes, mais elles pourront aussi représenter des qualités hétérogènes (par exemple des secondes d’arc et de temps), pourvu qu’on puisse estimer le rapport des erreurs qui ont pu avoir été commises, avec une égale facilité, dans chacune d’elles.
Le principe exposé dans l’article précédent se recommande aussi par cette raison que la détermination numérique des inconnues se réduit à un algorithme très-prompt, toutes les fois que les fonctions etc., sont linéaires. Supposons qu’on ait
et posons
Alors les équations de l’art. 177, d’après lesquelles doivent être déterminées les valeurs des quantités inconnues, seront les suivantes :
pourvu que nous supposions les observations également bonnes ; cas auquel nous avons appris, dans l’article précédent, à ramener tous les autres. On a donc, autant d’équations linéaires qu’il y a d’inconnues à trouver ; les valeurs de ces inconnues seront obtenues par l’élimination ordinaire.
Voyons maintenant, si cette élimination est toujours possible, ou si la solution peut quelquefois devenir indéterminée, ou même impossible. On sait, d’après la théorie de l’élimination, que le second ou le troisième cas doit se présenter, quand une des équations
étant omise, on peut, avec celles qui restent, en former une autre identique avec celle omise, ou qui lui soit contradictoire ; ou bien, ce qui revient au même, quand on peut assigner une fonction linéaire
qui soit identiquement nulle, ou au moins libre de toutes les inconnues etc. Supposons donc qu’on ait
On a spontanément l’équation identique
Si donc, par les substitutions
nous supposons que les fonctions deviennent respectivement
on aura évidemment l’équation identique
c’est-à-dire que l’on aura
mais de là, on doit nécessairement avoir
Il est, d’après cela, évident que toutes les fonctions doivent être constituées de manière que leurs valeurs ne changent pas quand les quantités etc., acquièrent des accroissements ou des diminutions quelconques proportionnels aux nombres etc. ; mais nous avons déjà prévenu ci-dessus, que les cas de ce genre, dans lesquels il est évident que la détermination des inconnues ne serait plus alors possible, même si les véritables valeurs des fonctions étaient données, n’appartiennent pas à ce sujet.
Enfin, nous pouvons facilement réduire au cas que nous venons de considérer, tous ceux dans lesquels les fonctions etc., ne sont pas linéaires. En désignant en effet, par etc., les valeurs approchées des inconnues etc. (que nous obtenons facilement si parmi les équations etc., nous en prenons seulement ), nous introduirons à la place des inconnues d’autres en posant etc. ; il est évident que les valeurs de ces nouvelles inconnues seront si petites, que l’on pourra négliger leurs carrés et leurs produits, ce qui rendra les équations spontanément linéaires. Si, après le calcul achevé, les valeurs des inconnues paraissaient, contre l’attente, assez grandes pour qu’il semblât peu sûr d’avoir négligé leurs carrés et leurs produits, la répétition de la même opération (en prenant à la place de etc., les valeurs corrigées de etc.) apporterait un prompt remède.
Toutes les fois qu’on a seulement une inconnue unique pour la détermination de laquelle les valeurs des fonctions etc., ont été, à l’aide d’observations également exactes, trouvées respectivement égales à etc., la valeur la plus probable de sera
en écrivant respectivement pour etc.
Pour estimer actuellement le degré de précision que l’on doit attribuer à cette valeur, supposons que la probabilité de l’erreur dans les observations, soit exprimée par
De là, la probabilité que la véritable valeur de doit être sera proportionnelle à la fonction
si est substitué à L’exposant de cette fonction peut être ramené à la forme
dans laquelle est indépendant de par conséquent, la fonction elle-même sera proportionnelle à
Il est donc évident, que le degré de précision qui doit être attribué à la valeur est le même que si cette valeur eût été directement trouvée par une observation dont la précision serait à la précision des observations primitives, comme est à ou comme est à l’unité.
Pour la recherche du degré de précision à attribuer aux valeurs des inconnues, il faudra, dans le cas où il y en a plusieurs, faire précéder cette recherche d’un examen attentif de la fonction etc., que nous désignerons par
I. Posons
il est évident que l’on a et, puisque
que la fonction doit être indépendante de Le coefficient etc., sera toujours, évidemment, une quantité positive.
II. Nous poserons de la même manière
et l’on aura
d’où il est clair que la fonction est indépendante à la fois de et de Ceci n’aurait pas lieu si pouvait devenir égal à zéro. Mais il est évident que se déduit de etc., en faisant disparaître, au moyen de l’équation la quantité des expressions par là, sera la somme des coefficients de dans etc., après cette élimination ; mais chacun de ces coefficients est au carré, et ils ne peuvent tous s’évanouir à la fois, si ce n’est dans le cas exclu ci-dessus, dans lequel les inconnues restent indéterminées. Il est donc évident que doit être une quantité positive.
III. En posant encore
nous aurons
et indépendant de de et de On prouverait au reste, de la même manière que dans II, que le coefficient doit être nécessairement positif. On voit en effet facilement, que est la somme des coefficients de dans etc., après qu’on a fait disparaître et de etc., au moyen des équations
IV. En posant de la même manière
on aura
indépendant de et une quantité positive.
V. De cette manière, si en outre de il y a encore d’autres inconnues, on pourra continuer ainsi, de telle sorte qu’on ait enfin,
expression dans laquelle tous les coefficients seront des quantités positives.
VI. Maintenant, la probabilité d’un système quelconque des valeurs déterminées des quantités est proportionnelle à la fonction c’est pourquoi, la valeur de la quantité restant indéterminée, la probabilité d’un système de valeurs déterminées des autres, sera proportionnelle à l’intégrale
prise depuis jusqu’à intégrale qui, par le théorème de l’illustre Laplace, est
cette probabilité sera donc proportionnelle à la fonction De même si, en outre, est traité comme une indéterminée, la probabilité d’un système de valeurs déterminées de etc., sera proportionnelle à l’intégrale
prise depuis jusqu’à laquelle est
c’est-à-dire proportionnelle à la fonction
D’une manière entièrement semblable, si est aussi regardé comme indéterminé, la probabilité d’un système de valeurs déterminées des autres etc., sera proportionnelle à la fonction et ainsi de suite. Supposons le nombre des inconnues porté à quatre ; la même conclusion s’appliquera aussi à un plus ou moins grand nombre d’inconnues. La valeur la plus probable de sera ici et la probabilité qu’elle différera de la véritable valeur de la quantité sera proportionnelle à la fonction d’où nous concluons que la mesure de la précision relative à attribuer à cette détermination est exprimée par si la mesure de la précision à attribuer aux observations primitives est supposée égale à l’unité.
Par la méthode de l’article précédent, la mesure de la précision a été convenablement exprimée pour cette seule quantité inconnue, à laquelle la dernière place a été donnée dans le travail d’élimination ; pour faire disparaître ce désavantage, il sera convenable d’exprimer le coefficient d’une autre manière. Des équations
il suit que peuvent aussi être exprimées en fonction de
de telle sorte que soient des quantités déterminées. Nous aurons donc (en restreignant à quatre le nombre des inconnues)
De là nous tirons la conséquence suivante : les valeurs les plus probables des inconnues etc., que l’on déduira par élimination des équations
seront, si l’on considère pendant un instant les quantités etc., comme indéterminées, évidemment exprimées, d’après le même mode d’élimination, par des fonctions linéaires de etc., de telle sorte qu’on ait
Ceci étant fait, les valeurs les plus probables de etc., seront évidemment etc., respectivement, et la mesure de la précision à attribuer à ces déterminations sera exprimée respectivement par
en supposant que la précision des observations primitives soit égale à l’unité. Ce que nous avons démontré précédemment, relativement à l’inconnue pour laquelle répond à peut être appliqué à toutes les autres par une simple permutation des quantités inconnues.
Pour éclaircir par un exemple les recherches précédentes, supposons que, par des observations dans lesquelles la précision est supposée la même, on ait trouvé
mais que par une quatrième observation, à laquelle on doit attribuer une précision de moitié moins grande, on ait trouvé
Nous substituerons à la place de cette dernière équation, la suivante :
et nous supposerons que celle-ci provient d’une observation jouissant d’une précision égale aux premières. De là nous avons
et de là, par élimination,
Les valeurs les plus probables des inconnues seront donc
et la précision relative à attribuer à ces déterminations, la précision des observations primitives étant représentée par l’unité, sera
pour | ||
pour | ||
pour |
Le sujet traité jusqu’ici pourrait donner lieu à plusieurs élégantes recherches analytiques, auxquelles cependant nous ne nous arrêterons pas, pour ne pas trop nous écarter de notre but. Par la même raison, nous devons réserver pour une autre occasion l’exposition des moyens par lesquels le calcul numérique peut être réduit à l’algorithme le plus expéditif. Qu’il soit permis d’ajouter ici une seule observation. Quand le nombre des fonctions ou des équations proposées est considérable, le calcul devient un peu plus incommode, par cette raison principalement, que les coefficients par lesquels les équations primitives doivent être multipliées pour obtenir etc., renferment le plus souvent des fractions décimales compliquées. Si, dans ce cas, on ne trouve pas qu’il soit utile d’effectuer très-soigneusement ces multiplications à l’aide des tables de logarithmes, il suffira généralement d’employer à la place de ces multiplicateurs d’autres plus convenables pour le calcul et qui en diffèrent peu. Cette licence ne pourra pas produire d’erreurs sensibles, excepté dans le cas seulement où la mesure de la précision dans la détermination des inconnues, se trouve beaucoup moindre que ne l’était la précision des observations primitives.
Le principe que les carrés des différences entre les quantités observées et calculées doivent produire une somme minimum, pourra du reste être aussi considéré, indépendamment du calcul des probabilités, de la manière suivante.
Quand le nombre des inconnues est égal au nombre des quantités observées qui en dépendent, on peut déterminer les premières de manière quelles satisfassent exactement aux dernières. Mais quand le nombre des premières est moindre que celui des dernières, cet accord ne peut être exactement obtenu, en tant que les observations ne jouissent pas d’une précision rigoureuse. Dans ce cas, il faut donc faire en sorte que l’accord soit le meilleur possible, c’est-à-dire que les différences soient atténuées autant que faire se peut. Mais ce principe a par lui-même quelque chose de vague. En effet, quoiqu’un système de valeurs des inconnues qui rend toutes les différences respectivement moindres qu’un autre, doive sans aucun doute être préféré à celui-ci, néanmoins le choix entre deux systèmes dans lesquels l’un offre un meilleur accord pour certaines observations, mais moins satisfaisant pour d’autres» est en quelque sorte arbitraire, et il est évident qu’un très-grand nombre de principes peuvent être proposés, d’après lesquels la première condition soit remplie. En désignant par etc., les différences entre les observations et le calcul, on satisfera à la première condition non-seulement si etc., est un minimum (ce qui est notre principe), mais aussi si etc., ου etc., ou, généralement, si la somme des puissances quelconques paires est un minimum. Mais, de tous ces principes, le nôtre est le plus simple, tandis que dans les autres on est conduit à des calculs très-compliqués. Au reste notre principe, dont nous nous servons déjà depuis l’année 1795, a été récemment donné par le célèbre Legendre dans l’ouvrage Nouvelles méthodes pour la détermination des orbites des comètes, Paris, 1806, ouvrage dans lequel sont exposées plusieurs autres propriétés de ce principe, que nous supprimons pour être plus bref.
Si nous adoptions pour exposant de la puissance paire, l’infini, nous serions conduits au système dans lequel les plus grandes différences sont plus petites que dans tout autre.
Laplace fait usage, pour la solution des équations linéaires, dont le nombre est plus grand que le nombre des inconnues, d’un autre principe qui avait déjà été proposé par le célèbre Boscovich, et qui est que les différences mêmes, mais toutes prises positivement, donnent une somme minimum. On peut facilement démontrer que le système des valeurs des inconnues qui est déduit de ce seul principe, doit nécessairement[2] satisfaire exactement à un nombre d’équations des proposées égal à celui des inconnues, de manière que les autres équations doivent seulement être considérées en tant qu’elles peuvent aider à déterminer le choix : si donc l’équation par exemple, est au nombre de celles qui ne sont pas satisfaites, il n’y aurait rien à changer au système des valeurs trouvées d’après ce principe, quoiqu’on eût observé à la place de une tout autre valeur pourvu qu’en désignant par la valeur calculée, les différences et soient affectées du même signe. Au reste, l’illustre Laplace tempère en quelque sorte ce principe par l’adjonction d’une nouvelle condition ; il demande, en effet, que la somme même des différences, prises avec leurs signes, soit nulle. Il suit de là, que le nombre des équations exactement satisfaites est moindre d’une unité que le nombre des inconnues ; mais ce que nous venons de faire observer aura encore lieu pourvu qu’il y ait au moins deux inconnues.
Revenons de ces recherches générales à notre but particulier, relativement auquel elles ont été entreprises. Avant qu’il soit permis de commencer la détermination la plus exacte de l’orbite d’après un plus grand nombre d’observations que celui qui est rigoureusement nécessaire, on doit déjà avoir une détermination approchée qui ne doit pas beaucoup s’écarter de toutes les observations données. Nous considérerons comme l’objet du problème, la détermination des corrections qu’il faut encore appliquer à ces éléments pour que l’accord soit obtenu le plus exactement. Puisqu’on peut supposer que ces corrections sont tellement petites qu’il est permis de négliger leurs carrés et leurs produits, les variations qu’en éprouvent les positions géocentriques calculées de l’astre pourront être déterminées par les formules différentielles données dans la seconde Section du premier livre. Les lieux calculés d’après les éléments corrigés que nous cherchons seront donc exprimés suivant des fonctions linéaires des corrections des éléments, et leur comparaison avec les lieux observés, d’après les principes exposés ci-dessus, conduira à la détermination de leurs valeurs les plus probables. Ces opérations sont tellement simples qu’elles n’exigent aucun éclaircissement ultérieur, et il est de soi-même évident que l’on peut faire usage d’un nombre quelconque d’observations, à une distance quelconque l’une de l’autre. La même méthode peut aussi être employée pour corriger les orbites paraboliques des comètes, si l’on a par hasard une longue série d’observations et qu’on demande la plus grande exactitude.
La méthode précédente s’applique principalement au cas où l’on désire la plus grande précision ; mais il se présente très-souvent des cas où l’on peut sans hésitation laisser un peu de côté cette précision, si par ce moyen il est possible d’abréger considérablement la longueur du calcul, surtout quand les observations n’embrassent pas encore un grand intervalle de temps, et par suite quand il s’agit de la détermination d’une orbite qu’on peut dire non définitive. Dans de semblables cas, la méthode suivante pourra être appliquée avec un avantage notable.
Que deux positions complètes de l’astre et soient choisies parmi tout l’ensemble des observations, et, qu’au moyen des éléments approchés, on calcule pour les temps correspondants les distances du corps céleste à la Terre. Qu’on forme ensuite, relativement à ces distances, trois hypothèses, en conservant dans la première les valeurs calculées, en changeant dans la seconde hypothèse la première distance, et la seconde dans la troisième hypothèse ; on pourra choisir à volonté l’une et l’autre variation proportionnellement à l’incertitude que l’on présume devoir exister dans ces distances. Au moyen de ces trois hypothèses, que nous indiquons dans le tableau suivant,
hyp. I. | hyp. II. | hyp. III. | |
Distance[3] correspondante au premier lieu. |
|||
Distance correspondante au second lieu |
que l’on calcule, d’après les deux lieux et à l’aide des méthodes exposées dans le premier livre, trois systèmes d’éléments, et après cela, pour chacun de ces systèmes, les lieux géocentriques de l’astre correspondant aux époques de toutes les autres observations. Soient ces lieux (chaque longitude et latitude, ou ascension droite et déclinaison étant désignée séparément)
Dans le premier système |
…… etc., | |||
Dans le deuxième |
…… etc., | |||
Dans le troisième |
…… etc., | |||
Soient ensuite les lieux observés, respectivement. |
…… etc., |
Maintenant, en tant qu’aux petites variations des distances correspondent des variations proportionnelles de chacun des éléments, aussi bien que des lieux géocentriques calculés d’après eux, on pourra supposer que les lieux géocentriques calculés d’après un quatrième système d’éléments, établi d’après les distances à la Terre sont respectivement , etc. De là, conformément aux recherches précédentes, seront déterminés de manière (en tenant compte de la précision relative des observations), que ces quantités s’accordent autant que possible avec etc., respectivement. On pourra déduire par une simple interpolation le système corrigé des éléments, soit d’après et les distances soit d’après les règles connues, à l’aide des trois premiers systèmes d’éléments.
Cette méthode diffère de la précédente à cet égard seulement, qu’on satisfait exactement aux deux lieux géocentriques, et ensuite le plus exactement possible aux autres lieux ; tandis que suivant l’autre méthode aucune observation ne l’emporte sur les autres, mais les erreurs sont, autant que faire se peut, distribuées entre toutes. La méthode de l’article précédent ne passera donc avant la première, que lorsque, accordant quelque partie des erreurs aux lieux il est permis de diminuer notablement les erreurs dans les autres lieux ; le plus souvent cependant, par un choix convenable des observations et on peut facilement éviter que cette différence ne prenne une trop grande importance. Il faudra, en effet, avoir soin d’adopter pour et des observations telles que non-seulement elles jouissent de la plus grande précision, mais aussi que les éléments qui en dérivent, ainsi que les distances, ne soient pas trop affectés par de petites variations dans les positions géocentriques elles-mêmes. On agirait par conséquent d’une manière peu prudente en choisissant des observations distantes l’une de l’autre d’un petit intervalle de temps, ou celles qui correspondraient à des lieux héliocentriques à peu près opposés ou coïncidants.
- ↑ Si, dans le troisième cas, les fonctions etc., étaient établies de telle sorte que de ces fonctions, ou un plus grand nombre, puissent être considérées comme fonctions des autres, le problème, relativement à ces fonctions, serait encore plus que déterminé, mais indéterminé relativement aux quantités etc. ; c’est-à-dire, qu’il ne serait réellement pas possible de déterminer alors les valeurs de ces dernières quantités, quand même les valeurs des fonctions etc., seraient données absolument exactes ; mais nous écarterons ce cas de notre recherche.
- ↑ Excepté dans les cas spéciaux où la solution reste de quelque manière indéterminée.
- ↑ Il sera encore plus commode d’employer, à la place de ces distances, les logarithmes de leurs distances raccourcies.