La méthode comparative en linguistique historique/Leçon III

La bibliothèque libre.
H. Aschehoug & Co — Honoré Champion (p. 22-42).



III.

DES PREUVES EMPLOYÉES.


Pour établir l’existence d’une ancienne langue commune, il faut retrouver dans les langues comparées les traits spécifiques de cette langue pour autant qu’ils se sont maintenus. Il y a donc à chercher comment se comportent les divers éléments de la langue ; car ils ne se conservent pas également ni de la même manière. Toute langue comprend trois systèmes distincts qui sont liés les uns aux autres de certaines manières, mais qui sont susceptibles de varier en une large mesure indépendamment les uns des autres : la morphologie, le phonétisme et le vocabulaire.


La morphologie, c’est-à-dire l’ensemble des procédés par lesquels on modifie et on groupe les mots pour constituer des phrases, est ce qu’il y a de plus stable dans la langue. Mais il faut distinguer ici entre les procédés généraux et le détail des formes.

À les considérer d’une manière générale, les types morphologiques sont peu variés. La principale différence consiste en ceci que, dans certaines langues, les rapports entre les mots et les divers emplois des mots sont marqués par des formes spéciales qu’affectent les mots eux-mêmes, tandis que, dans d’autres langues, les rapports et les emplois sont marqués par des éléments additionnels, par des particules ou mots accessoires et par l’ordre des mots. Dans les premières langues, il y a, comme on dit, flexion. Cette distinction n’est du reste pas absolue, et il y a des mélanges des divers procédés à doses diverses.

Bien que l’usage fait de tel ou tel type se maintienne souvent très longtemps et laisse des traces alors même que le type tend à s’abolir dans l’ensemble, on ne peut guère faire usage de ces types généraux pour démontrer une « parenté de langues ». Car il arrive souvent que, avec le temps, le type tende à s’effacer plus ou moins complètement, ainsi qu’il ressort de l’histoire des langues indo-européennes.

L’indo-européen commun présentait de la manière la plus extrême le type qu’on nomme « flexionnel ». Tous les emplois des mots, tous les liens entre les mots se marquaient par des différences de la forme interne des mots. En sanskrit, où ce caractère de l’ « indo-européen commun » est particulièrement bien conservé, « je suis » se dit ásmi, « ils sont » se dit sánti, « il a été » se dit ā́sa, et ainsi de suite. Si le mot « père » est sujet, il est de la forme pitā́ ; s’il est complément direct, il est de la forme pitáram ; et, s’il est complément de nom, il est de la forme pitúḥ. Les différences sont profondes, on le voit, entre les formes d’un même mot ; et c’est au moyen de ces différences que s’indique tout le rôle des mots. Jusqu’à présent, les langues de la famille indo-européenne même les plus évoluées ont gardé quelque chose de ce type ancien ; en français, par exemple, le substantif est devenu invariable (l’-s du pluriel est purement graphique) ; mais le verbe comporte encore une forte part de flexion : la différence entre aime et aimez, j’aimais et nous aimions est caractéristique, et plus encore celle entre je veux, nous voulons, je voudrais, j’ai voulu, etc. Toutefois la structure générale du français actuel diffère absolument de celle qu’avait l’indo-européen. Et celle de l’anglais en diffère plus encore. Les langues romanes, la plupart des langues germaniques, les langues iraniennes ne méritent plus vraiment aujourd’hui le nom de « flexionnelles ». Et même les langues indo-européennes les plus conservatrices ont un type tout autre que l’indo-européen commun. Les structures des langues indo-européennes actuellement parlées sont très différentes de la structure qu’avait l’indo-européen commun et de plus très différentes entre elles. Dès lors, ce n’est pas à la structure générale qu’on reconnaît une langue indo-européenne.

La langue « indo-européenne » commune procédait par suffixation, c’est-à-dire que les éléments grammaticaux affixés à la partie du mot exprimant le sens étaient toujours postposés. Ainsi en latin, où cet usage s’est bien maintenu, la marque -ēs du nominatif et de l’accusatif pluriel et la marque -um du génitif pluriel sont postposées à patr- : patr-ēs « les pères », patr-um « des pères ». En français, au contraire, il tend à se constituer des préfixes. Le latin distinguait amō, amās, amat par la fin du mot. Le français distingue j’aime, tu aimes (avec -s purement graphique), il aime, par les éléments je, tu, il que la grammaire traditionnelle qualifie de « pronoms », mais qui n’ont pas d’existence autonome et qui sont actuellement de purs signes grammaticaux préposés. À cet égard encore, le français procède autrement que ne faisait l’indo-européen.

Ce n’est donc pas avec de pareils traits généraux de structure, sujets à changer du tout au tout en l’espace de quelques siècles, et du reste comportant seulement des variations peu nombreuses, qu’on peut établir des parentés de langue. Qui comparerait le latin où l’on a liber Petri ou Petri liber (les deux ordres sont possibles), c’est-à-dire où le rapport entre « Pierre » et « livre » est marqué par la forme Petri du nom dont le cas sujet est Petrus, le cas complément direct Petrum, etc., avec des variations de la fin du mot, et le français, où le rapport entre le nom et son complément est indiqué par la particule préposée de et par la place de de Pierre ne trouverait entre les procédés employés par les deux langues aucun trait commun.

Ce qui est probant pour établir la continuité entre une « langue commune » et une langue ultérieure, ce sont les procédés particuliers d’expression de la morphologie. Par exemple, il n’est pas rare que le rapport de dépendance entre deux substantifs soit exprimé par une particule soit préposée, comme fr. de, soit postposée comme angl. -s. Mais le fait que cette particule est de la forme de ou de la forme -s est caractéristique ; car n’importe quel autre phonème pourrait aussi bien indiquer le rapport, si la tradition n’en avait décidé autrement. Dès lors le fait que le rapport est marqué par de préposé au complément est un caractère distinctif d’un parler français, et le fait que le rapport est marqué par -s postposé au complément un caractère distinctif d’un parler anglais. — Il faut ajouter que l’emploi de de peut disparaître d’un parler français ou celui de -s d’un parler anglais sans que, pour cela, ces parlers cessent d’être français ou anglais. Seuls, les faits positifs ont une valeur probante.

Les faits singuliers de cette sorte sont souvent stables. La prononciation peut se transformer, le vocabulaire peut changer, alors que ces traits demeurent. Ainsi, dans les parlers actuels de la France du Nord, les formes locales des mots se modifient pour être conformées aux formes françaises, le vocabulaire se renouvelle, et l’on tend en général à parler suivant l’usage français commun. Ce qui subsiste en dernier lieu, ce sont des particularités locales de la morphologie, ainsi la marque du masculin et du féminin par i dit, a dit, là où le français commun a il dit, elle dit. Les faits particuliers de cette sorte sont appris dès l’enfance, ils deviennent des habitudes dont on ne prend pas conscience, et ils sont susceptibles de demeurer alors que tout le reste se modifie.

Dès lors une langue à morphologie touffue et complexe, comprenant un grand nombre de faits particuliers, se prête bien à la démonstration des parentés, tandis qu’une langue à morphologie simple, opérant surtout avec des procédés généraux tels que l’ordre des mots, rend malaisée la découverte de preuves valables. On n’a presque pas besoin de démontrer qu’une langue est indo-européenne : partout où l’on a trouvé une langue indo-européenne encore inconnue, le « tokharien » ou le « hittite » dans les derniers temps, le caractère indo-européen s’en est révélé dès le début du déchiffrement et de l’interprétation. Au contraire, les langues d’Extrême-Orient qui, comme le chinois ou l’annamite, n’offrent presque pas de particularités morphologiques, n’ont par là même rien où puisse se prendre le linguiste qui essaie de trouver des langues parentes aux parlers chinois ou aux parlers annamites ; et la restitution d’une « langue commune » dont le chinois, le tibétain, etc. par exemple, seraient des formes postérieures, se heurte à des obstacles quasi invincibles.

Plus sont singuliers les faits dont on constate entre deux langues la concordance, et plus grande est la force probante de la concordance. Les formes anomales sont donc celles qui sont le plus propres à établir une « langue commune ».

Le fait que il est, ils sont, je fus du français concorde avec est, sunt, fuī du latin est de nature à faire apparaître que le français est une forme nouvelle prise par le latin. Des concordances comme je veux, nous voulons, je voulus avec uolō, uolumus, uoluī, ou comme je dis, nous disons, dit avec dīcō, dīcimus, dictus viennent confirmer la preuve. Les verbes « irréguliers » apportent ainsi à la démonstration des moyens de preuve en grand nombre.

L’adjectif confirme la démonstration. On y observe en effet la distinction d’un masculin et d’un féminin, dont l’emploi est arbitraire, quand elle ne dépend pas du sexe. Or, cette distinction dénuée de sens se trouve en français comme en latin : veston neuf et veste neuve, de même que le latin a nouus, noua. Il apparaît même dans certaines formes, l’article la, les adjectifs possessifs ma, ta, sa, que le féminin se caractérise parfois par a en français comme en latin.

Plus une langue comprend ainsi de catégories grammaticales non significatives ou de formes anomales, et plus la démonstration des parentés et la restitution d’une langue commune initiale sont faciles pour le linguiste.

La communauté initiale ne se reconnaît pas toujours à une conservation pure et simple ; elle se traduit souvent par des innovations divergentes. Ainsi l’indo-européen avait un certain type de flexion verbale de forme compliquée qui a tendu à s’éliminer partout ; on en reconnaît la présence ancienne à des innovations qui sont diverses suivant les langues. Par exemple il y avait un présent de la forme *eiti « il va », *y-enti ou *iy-enti, *y-onti ou *iy-onti « ils vont » ; le sanskrit le garde sous la forme éti, yánti ; le grec attique l’a, un peu plus altéré, dans eisi, iāsi ; le latin, avec plus d’altération encore, dans it, eunt ; le vieux lituanien a le singulier eiti ; mais ces formes étaient trop singulières : le lituanien moderne a remplacé eiti par une formation de type nouveau, régulière en lituanien, eina ; le slave a, dès le ixe siècle après J.-C., dans la langue des anciens traducteurs, idetŭ « il va », idǫtŭ « ils vont ». Les formes nouvelles du lituanien, einu « je vais », et du slave, idǫ, réfléchissent à leur manière la forme ancienne qui s’est éliminée.

Dans l’exemple cité, la forme ancienne est conservée par certaines langues, et l’on s’explique aisément l’innovation de certaines autres. Mais il arrive que la forme ancienne ne soit conservée nulle part, et ce n’est que l’absence de concordance de détail des formes rapprochées qui laisse supposer une forme singulière éliminée par la suite. Il a dû y avoir en indo-européen un présent de la forme *meləti et *moləti « il moud » avec une 3e personne du pluriel *m°lenti et *m°lenti. Cette flexion difficile à manier s’est éliminée partout. On en reconnaît néanmoins l’existence ancienne à ce que le slave a meljetŭ, le lituanien malu et le gotique maliþ, l’irlandais melid et les langues brittoniques toutes voisines une forme à vocalisme différent mal-, etc. Nulle part, les formes indo-européennes supposées ici ne sont conservées ; mais on les restitue par la connaissance qu’on a du système indo-européen et par les divergences observées entre les langues historiquement connues.

L’observation des faits singuliers ne dispense pas d’examiner l’ensemble de la morphologie. Toute morphologie constitue un système complet. D’après l’ensemble des concordances, il faut donc restituer le système de la « langue commune », dans la mesure du possible. Et, ceci fait, il faut voir comment à ce système s’opposent les systèmes morphologiques, souvent tout différents, on l’a vu, des langues en lesquelles la langue initiale s’est transformée. Les particularités sont le moyen décisif de preuve. Mais la démonstration n’est définitivement acquise que lorsqu’on a confronté système morphologique à système morphologique et qu’on a vu comment il est possible de passer du système initial aux systèmes ultérieurs.

On observe souvent alors que des caractères généraux du système ancien se maintiennent longtemps. Ainsi, en indo-européen commun, où chaque mot portait en lui-même la marque de son rôle dans la phrase, le nom se distinguait nettement du verbe. Or, encore aujourd’hui, dans les langues indo-européennes, la distinction du nom et du verbe est demeurée nette partout.


Le phonétisme comporte aussi la mise en présence d’un système ancien et de systèmes nouveaux, tous ces systèmes pouvant différer les uns des autres aussi profondément qu’il est imaginable.

Mais les différences d’un système à l’autre ne sont pas capricieuses. S’il est souvent impossible de reconnaître des correspondances régulières entre deux des langues issues d’un original commun, les correspondances entre la langue commune et chacune de ces langues obéissent à des règles fixes et qui se laissent exactement formuler. C’est ce que l’on appelle « lois phonétiques ».

À p, t, k de l’indo-européen répondent en germanique f, þ, x (d’où h) et, en certaines conditions, ƀ, đ, ɣ ; à b, d, g de l’indo-européen, répondent germ. p, t, k ; à bh, dh, gh de l’indo-européen répondent germ. b, d, g (ƀ, đ, ɣ en position intervocalique). Ce système régulier de correspondances en germanique est ce que l’on appelle la « mutation consonantique », ou loi de Grimm (vue en grande partie par Rask, un peu avant Grimm, mais posée comme loi par Grimm). La régularité des correspondances entre la « langue commune » initiale et les langues ultérieures exprime le fait que les changements de la prononciation n’atteignent pas isolément tel ou tel mot, telle ou telle forme, mais qu’ils portent sur le système phonique même.

Du principe de la méthode, il résulte que des règles de correspondances peuvent être posées entre la langue initiale et chacune des langues qui la continuent, mais non entre les diverses langues continuant une même langue commune. On peut poser que p initial de l’indo-européen est représenté en grec et en sanskrit par p, en gotique par f, ainsi dans gr. patḗr, skr. pitā́ et got. fadar « père », et que initial de l’indo-européen devant o est représenté en grec par p, en sanskrit par k et en gotique par hw, ainsi gr. póteros, skr. kataráḥ, got. hwaþar « lequel des deux ». Les deux correspondances constatées en fait :

gr. p = skr. kp = got. hwf
gr. p = skr. k = got. hw
ne sont intelligibles que par rapport à une forme indo-européenne commune supposée pour les expliquer.

Ce n’est pas avec des ressemblances de formes qu’on opère quand on compare des langues d’une même famille, mais uniquement avec des règles de correspondances. On a vu ci-dessus, p. 6, que le nom de nombre « deux » de l’arménien, qui est erku, répond à l’ancien *dwō (ou *duwō) de l’indo-européen. Cette correspondance semble au premier abord étrange. Mais il y a une règle générale en vertu de laquelle à dw- de l’indo-européen répond erk- de l’arménien. Car on connaît deux autres exemples de cette correspondance. L’indo-européen a eu une racine *dwei- « craindre » qui est largement représentée en grec homérique par des formes verbales telles que *dedwoa (noté deidō), dedwoike (noté deidoike) « je crains » ou nominales telles que *dweos (noté deos) « crainte » ; l’arménien y répond par erkiwł « crainte », erkeay « j’ai craint ». Il y a eu un adjectif *dwāro- « long », conservé notamment par le grec ; or, l’arménien a un adjectif erkar « long ». La règle est donc fondée sur trois rapprochements évidents. Si l’on pense au nombre restreint des mots indo-européens connus présentant l’initiale *dw-, *duw-, la coexistence de ces trois rapprochements apparaît probante.

La correspondance s’explique du reste. Le groupe de consonne dentale suivie de w aboutit en arménien à une gutturale : tw- est représenté par k‘-, ainsi dans k‘o « de toi », en face de formes telles que twe (d’où attique se) du grec. La sourde k provient de ce que, en arménien comme en germanique, il y a eu une mutation des anciennes occlusives sonores en sourdes : d passe à t, g à k. L’r qui précède est une trace de l’ancien caractère sonore de la consonne initiale du groupe (pour le détail de l’explication, voir M. Grammont, Mémoires de la Soc. de ling., XX, p. 252), cette r a entraîné à son tour le développement de l’e initial qui figure dans erku. La présence de -r- à l’intérieur du mot a du reste suffi à empêcher le développement de r initiale : kr-kin est le mot qui signifie « double » (kr-kin repose sur un ancien *kirkin ou *kurkin). Tout, dans la correspondance si étrange de arm. erk- avec *dw-, résulte de la structure de l’arménien. Une correspondance qui ne s’expliquerait pas ainsi serait suspecte.

Dans des groupes de langues où l’on a de longues séries de rapprochements clairs et dont par suite l’appartenance à une même famille ne fait pas question, on peut utiliser des correspondances surprenantes, telles que celle de arm. erk- en face de *dw-, *duw- des autres langues du groupe, et l’on arrive à pouvoir poser arm. erk(i)- = lat. bi-, si bizarre que cela paraisse au premier abord. Il va de soi que l’on ne peut se servir de pareilles correspondances pour commencer à établir une communauté de langues. On est obligé de commencer par des rapprochements dont l’explication apparaît aisément.

La régularité des correspondances n’exclut pas l’existence de traitements particuliers. Dans la phrase, les mots se trouvent en des positions diverses, en des conditions diverses. La régularité des traitements provient souvent de ce qu’il s’est fixé une forme moyenne entre des cas divers suivant les positions dans la phrase. Mais il y a notamment des cas où des formes prononcées plus rapidement ou avec peu de soin sont plus usuelles que d’autres, et il résulte de là des traitements spéciaux des mots accessoires : une réduction comme celle de hiu tagu « ce jour-ci » a hiutu (all. mod. heute) en vieux haut allemand n’entre dans aucune catégorie générale.

Ces phénomènes qui ne se ramènent pas à des formules générales ne font pas difficulté dans une langue dont l’histoire est connue et pour laquelle on possède des règles de correspondances bien établies. Il est superflu de noter que, dans une langue dont la théorie n’est pas établie de manière exacte, des faits aussi aberrants sont inutilisables et qu’il convient d’en faire provisoirement abstraction.


Quant au vocabulaire, c’est dans la langue l’élément de tous le plus instable. Les mots sont sujets à disparaître pour les raisons les plus variées ; ils sont remplacés par de nouveaux termes. Au vocabulaire indigène il peut s’adjoindre des mots nouveaux aussi et plus nombreux que les anciens : c’est ainsi que, au vocabulaire germanique de l’anglais, s’est superposé un élément latin et français aussi considérable que l’élément germanique. Il arrive même que tout le vocabulaire appartienne a un groupe autre que celui dont relève la morphologie : le tsigane arménien a une morphologie et une phonétique tout arméniennes et un vocabulaire tout tsigane.

Là même où ils subsistent, les mots sont susceptibles de changer si fort de valeur que, malgré l’ancienneté de leur forme, ils sont vraiment des mots nouveaux. Le nom indo-européen du chef de famille indo-européen, le *pəter-, a subsisté en français ; c’est le mot père. Mais au lieu que le mot indo-européen désignait un rôle social, et qu’on pouvait qualifier de *pəter- le dieu suprême, comme le plus grand des chefs de famille, le mot français désigne de plus en plus « celui qui engendre », et il passe au sens de lat. genitor, presque au sens de « mâle » : on dit d’un lapin mâle que c’est un père. Ainsi fr. père continue un mot indo-européen, mais avec une valeur si différente de la valeur indo-européenne que c’est en réalité un mot nouveau.

Malgré cette instabilité fréquente du vocabulaire, ce sont les concordances de vocabulaire qui frappent d’abord quand on rapproche des langues entre elles. Souvent même on ne dispose que du vocabulaire, soit que les langues envisagées soient mal connues et qu’on n’ait de témoignages que sur le vocabulaire, soit qu’il s’agisse de langues à grammaire très simple, comme en Extrême-Orient, soit que les morphologies qui ont subsisté se soient constituées trop tard, après la période de communauté supposée. Il importe donc beaucoup d’examiner comment peut se prouver une concordance de vocabulaire.

Il a été noté déjà que les rapprochements étymologiques valables ne se font jamais d’après des ressemblances de forme phonétique, mais seulement d’après des règles de correspondances : si l’on peut rapprocher arm. erku de russe dva, ce n’est pas que les deux formes se ressemblent : les formes phonétiques n’ont rien de commun ; c’est que les règles de correspondances permettent le rapprochement, ō de l’indo-européen aboutissant à a en slave, à u en arménien, et duw- de l’indo-européen aboutissant à dv- en russe, erk- en arménien.

Pour autant qu’elles ne s’expliquent pas par des conditions propres à tel ou tel mot, les irrégularités dans les correspondances dénoncent soit un emprunt à d’autres langues soit une étymologie à écarter. Un ancien ca- du latin est représenté en français par cha-, che-, chè-, ainsi dans campum donnant champ, carrum donnant char, caballum donnant cheval, carum donnant cher, etc. ; si donc on a camp en regard de campum, c’est que le mot n’appartient pas à la tradition ancienne du français ; en fait il vient de l’italien, et l’on sait en effet quand et pourquoi il a été « emprunté ». C’est un b- qui en germanique peut répondre à f- du latin ; on a par exemple en latin flōs, flōris et en allemand blume ; dès lors feuer de l’allemand n’a aucun rapport avec feu du français : il suffit d’ailleurs de penser aux correspondants romans de fr. feu, à savoir it. fuoco, esp. fuego, pour que la ressemblance de feu et de feuer s’efface. On ne fait donc des rapprochements qu’avec des formules précises de correspondances — et en prenant soin d’éviter ce qui est dû à des emprunts.

Il est malheureusement difficile de déterminer a priori ce qui a chance d’être indigène et ce qui a chance d’être emprunté. Les verbes et les adjectifs sont plus ordinairement indigènes que les substantifs : des verbes comme vivre et mourir, venir et dormir du français actuel sont encore des verbes indo-européens, et de même des adjectifs comme vif, vieux, neuf, etc. Néanmoins un verbe fort comme all. schreiben est emprunté à lat. scrībere. Inversement beaucoup de substantifs français tels que pied, chien, veuve, etc. sont indo-européens. — Le risque qu’un mot soit emprunté est toujours grand, et l’étymologiste, d’une langue ancienne ou récente, qui raisonne comme si les mots à expliquer avaient a priori toutes chances d’être indigènes s’expose à des erreurs fréquentes.

Là où il s’agit de mots remontant vraiment à la « langue commune », il faut restituer un mot de cette langue défini à tous égards, et ne pas se contenter de rapprocher de petits éléments radicaux. Et, comme les risques d’erreur sont grands, il est nécessaire de s’assurer, par des précisions, que les concordances observées ne sont pas fortuites.

Le premier point, sur lequel on est d’accord en fait sinon en principe, c’est qu’une étymologie est valable seulement si les règles de correspondance phonétique sont appliquées d’une manière exacte, ou, au cas où une divergence est admise, si cette divergence est expliquée par des circonstances particulières rigoureusement définies.

Il va de soi que la concordance risque d’autant moins d’être fortuite que le nombre des éléments phoniques qui se correspondent est plus grand.

Le hasard ne peut évidemment pas faire que « veuve » se dise vidhávā en sanskrit, vĭdova en slave, widdewū en vieux prussien, widuwo en gotique, fedb en irlandais, uidua en latin, étant donné que, par exemple, f de l’irlandais et u- (consonne) du latin répondent au v initial du sanskrit. La concordance de w, de i, de dh et de u, dans cet ordre, ne saurait être accidentelle. Entre les formes sanskrite, slave, prussienne, d’une part, et les formes germanique, irlandaise et sans doute latine, de l’autre, il y a, il est vrai, une différence : la présence d’une voyelle e (ou o) entre dh et w dans la première langue et l’absence de cette voyelle dans les autres ; cette différence ne fait pas difficulté ; car elle relève des alternances vocaliques connues de l’indo-européen.

Mais si, au lieu de comparer ainsi quatre éléments phoniques se correspondant exactement, on n’en compare que trois, la preuve est moins forte, pour devenir fragile si l’on dispose seulement de deux éléments concordants, et à peu près nulle si l’on dispose d’un seul. Aussi les linguistes qui opèrent avec de petits éléments radicaux et qui même souvent analysent les racines pour ne plus rapprocher que des fragments de racines ruinent d’avance par là la démonstration qu’ils cherchent. Un rapprochement de mots complets ayant quelque étendue peut être sûr. Un rapprochement qui porte seulement sur une ou même deux consonnes radicales est sans valeur s’il n’est pas appuyé par des faits tout particuliers.

La concordance de sens doit être aussi exacte, aussi précise que la concordance de forme phonique (suivant les règles de correspondance). Ceci ne veut pas dire que les sens doivent coïncider plus que le phonétisme ; seulement les divergences des sens, s’il y en a, doivent s’expliquer, non par des possibilités vagues et générales, mais par des circonstances particulières. Le fait que le fr. ouaille repose sur lat. ouicula n’est pas rendu douteux par le fait que, dans le français actuel, ce mot désigne seulement le fidèle du prêtre de telle ou telle église. Mais le rapprochement se justifie parce qu’on sait que les fidèles d’une église chrétienne sont couramment comparés à un troupeau que fait paître le pasteur de cette église. Dans les parlers locaux français, le mot ouaille se trouve du reste au sens de « brebis », ce qui achève de démontrer la correction de l’étymologie.

En matière d’étymologie indo-européenne, le fait que les mots ont des flexions variées fournit des confirmations décisives. Soit, par exemple, le mot qui signifie « mouton » (mâle ou femelle : l’indo-européen n’a pas de noms distincts pour les animaux suivant le sexe) : sanskrit áviḥ, grec óis (ainsi chez Homère), lat. ouis, lituanien avis ; la concordance de sens et de forme entre toutes ces langues est parfaite ; et, comme on arrive à restituer ainsi un mot bien défini par la forme phonique et par le sens, l’étymologie peut passer pour assurée déjà. Mais il s’ajoute encore ceci que les deux langues les plus anciennement attestées, celles qui par là sont propres à donner l’idée la plus juste de certains détails des faits indo-européens, ont une flexion de type particulier : le génitif-ablatif sanskrit ávyaḥ concorde exactement avec grec oiós, qui repose sur *owyós. Dans les autres langues, la flexion a été normalisée, ainsi qu’on l’attend. Mais le sanskrit et le grec fléchissent le mot de même. C’est une précision supplémentaire qui achève d’exclure le hasard et ajoute à la rigueur de la démonstration.

Quand on doit restituer une « langue commune » initiale, il y a lieu de tenir compte du nombre de témoignages qu’on a pour un mot donné. Une concordance de deux langues, si elle n’est pas totale, risque d’être fortuite. Mais, si la concordance s’étend à trois, quatre ou cinq langues bien distinctes, un hasard devient moins vraisemblable. Bien que rādiy « à cause de » du vieux perse et radi « à cause de » du slave ne se retrouvent pas ailleurs, on n’hésite pas à rapprocher les deux mots parce que forme, sens et détail de l’emploi concordent de tout point. À part un cas de ce genre, un rapprochement de mots trouvés dans deux langues indo-européennes seulement est suspect, à moins qu’on ne puisse reconnaître des conditions spéciales ayant déterminé l’élimination du mot dans les autres langues.

De quelque langue qu’il s’agisse, une étymologie ne peut passer pour prouvée que si un ensemble de concordances précises établit que les ressemblances des mots rapprochés ne peuvent être dues au hasard.

Tout mot n’a pas droit à une étymologie, comme on le croirait parfois à parcourir les dictionnaires étymologiques. La règle de méthode est que seuls des faits positifs bien déterminés justifient un rapprochement : la preuve que le hasard est exclu est à la charge de l’étymologiste. Cette preuve peut être administrée de façons diverses suivant les langues et suivant les cas ; les conditions en varient d’une langue à l’autre, d’un mot à l’autre. Mais toujours il faut que les preuves soient précises, rigoureuses.

Aussi le nombre des bonnes étymologies est-il assez restreint, au moins pour les langues dont l’histoire n’est connue que par comparaison et où la méthode comparative ne trouve pas dans des séries de textes d’époques diverses l’appui de témoignages historiques précis. Quand on lit un manuel de grammaire comparée, on s’étonne d’abord de le trouver bâti sur un petit nombre de rapprochements. C’est qu’il y en a peu sur lesquels il soit permis de faire fond sans réserve.

Une langue comme l’indo-européen, où les mots sont le plus souvent au moins dissyllabiques ou trisyllabiques et où les flexions sont variées et complexes, se prête bien à des démonstrations étymologiques parfaites (on peut négliger les fantaisies, plus ou moins laborieuses, des linguistes qui se contentent à bon marché). De même le sémitique, avec ses racines qui comprennent normalement trois consonnes, permet des étymologies parfaites. Au contraire, les langues où les mots sont courts, souvent monosyllabiques, et ne comportent pas de flexions particulières, excluent, par leur structure, les démonstrations étymologiques rigoureuses. Il y aura là une méthode nouvelle à trouver si l’on veut parvenir à de véritables démonstrations.

On n’a envisagé ici que les étymologies faites par comparaison entre langues diverses et reportant à un mot de la langue commune initiale. Pour déterminer de quelle manière peut se faire l’histoire de tous les mots — ce qui est hors du cadre de ces conférences —, il faudrait une longue étude, et qui envisagerait des procédés de toutes sortes.

Par exemple, il y a des mots qui s’expliquent, à l’intérieur d’une langue donnée, par des procédés de formation propres à cette langue. Un nom comme (w)érgon « œuvre » du grec trouve une étymologie par le rapprochement avec werk de l’allemand et par l’observation que la forme de ce mot est normale en indo-européen, la racine se retrouvant du reste en arménien et en iranien. Mais, pour expliquer órganon « instrument » du grec, il faut envisager un suffixe courant qui a fourni au grec bien d’autres noms.

Il y a beaucoup de mots dont l’histoire ne s’explique que par des données de fait : ainsi organum du latin n’est explicable que si l’on sait que le vocabulaire technique du latin est en grande partie grec ou imité du grec. Et, si l’on a en français deux représentants de ce mot, orgue et organe, avec des sens qui n’ont rien de commun ; ceci résulte de conditions spéciales ; si ces conditions sont connues, c’est parce qu’il s’agit de faits ayant eu lieu durant des périodes historiques ; aucune méthode comparative ne permettrait de les découvrir.

En fait, la plus grande part de l’étymologie des mots échappe à la méthode comparative et relève de l’histoire faite à l’aide de témoignages. Là où les témoignages manquent, et où l’on ne peut suivre, en se servant de données positives et précises, les accidents survenus à un mot, il est le plus souvent vain d’essayer d’en donner une véritable étymologie.


Qu’il s’agisse de morphologie, de phonétique ou de vocabulaire, le principe qu’il ne faut jamais perdre de vue, c’est que les rapprochements valent seulement dans la mesure où ils sont soumis à des règles strictes. Plus le linguiste se donne de liberté, plus ses rapprochements comportent d’arbitraire, et plus ses démonstrations sont précaires. Par exemple, le linguiste qui interprète des noms propres d’un pays par des rapprochements avec un idiome supposé parent de celui qui avant un changement de langue se parlait dans ce pays joue un jeu dangereux. Si l’on est sûr de la langue qui se parlait anciennement et si l’on connaît bien des langues toutes proches de celle-ci, quelques explications de ce genre sont sûres : une localité gallo-romaine nommée Brīua (Brive) a certainement un nom gaulois parce qu’elle est en un point où un pont a dû toujours exister, que les langues celtiques conservées supposent un nom brīwā du « pont » et que le latin a pris la place du gaulois, langue sûrement celtique, dans le pays où est Brive. Mais il est risqué d’expliquer par un rapprochement avec des langues caucasiques tel nom de localité grecque, dans un cas où rien n’avertit des sons que doit avoir étymologiquement le nom propre envisagé, où les langues rapprochées ont une forme non identique et où aucune donnée historique ne prouve qu’il ait été parlé une langue prochement apparentée aux langues caucasiques. D’une manière générale, les étymologies de noms propres sont incertaines parce que, des deux données dont la concordance avec des faits d’autres langues établit la valeur, le sens et la forme phonique, on peut utiliser un seul : la forme phonique. Les linguistes qui s’intéressent surtout à l’étymologie des noms propres sont souvent des aventuriers de la linguistique, et peu nombreux sont ceux qui ont toutes les exigences de méthode qu’il faut.