La méthode comparative en linguistique historique/Leçon I

La bibliothèque libre.
H. Aschehoug & Co — Honoré Champion (p. 1-11).



I.

DÉFINITION DE LA MÉTHODE COMPARATIVE.


Il y a deux manières différentes de pratiquer la comparaison : on peut comparer pour tirer de la comparaison soit des lois universelles soit des indications historiques. Ces deux types de comparaison, légitimes l’un et l’autre, diffèrent du tout au tout.

Il se rencontre partout dans le monde des contes d’animaux : les ressemblances entre les divers animaux et l’homme sont telles qu’il est naturel de prêter aux animaux des aventures comparables à celles qui arrivent aux hommes et d’exprimer par là des choses qu’il ne serait pas aussi facile de faire entendre directement. On peut comparer ces contes entre eux pour en définir les formes, les caractères, l’emploi, et pour faire ainsi une théorie générale des contes d’animaux. Les concordances que l’on constate résultent de l’unité générale de l’esprit humain, et les différences de la variété des types et des degrés de civilisation. On aboutit ainsi à s’instruire sur les caractères généraux de l’humanité, mais on n’apprend rien sur son histoire.

Si l’on examine, avec un jeune savant français, M. Dumézil, les mythes indo-européens relatifs à la boisson d’immortalité, on obtient des résultats tout autres. L’idée qu’il y aurait une boisson propre à conférer l’immortalité est trop naturelle pour être caractéristique. Mais, quand on rencontre, d’une manière plus ou moins complète, chez les divers peuples de langue indo-européenne, la légende d’une boisson d’immortalité fabriquée dans une cuve gigantesque, quand à cette légende se joint l’histoire d’une fausse fiancée, et le récit d’une lutte entre des dieux et des êtres démoniaques, il y a là un ensemble de faits singuliers qui n’ont pas en eux-mêmes de liens entre eux et dont la réunion ne saurait, par suite, être fortuite.

Si le sens à exprimer par la langue était lié par un lien naturel, lâche ou étroit, aux sons qui l’indiquent, c’est-à-dire si, par sa valeur propre, en dehors de la tradition, le signe linguistique évoquait en quelque manière une notion, le seul type de comparaison utilisable pour le linguiste serait le type général, et toute histoire des langues serait impossible.

Mais, en fait, le signe linguistique est arbitraire : il n’a de valeur qu’en vertu d’une tradition. Si l’on exprime en français l’unité par un, une, la dualité par deux, etc., ce n’est pas parce que les mots un, une — deux —, etc., ont par eux-mêmes un rapport quelconque avec l’unité, la dualité, etc., mais uniquement parce que tel est l’usage enseigné par ceux qui parlent à ceux qui apprennent à parler.

Seul, le caractère totalement arbitraire du signe rend possible la méthode comparative historique qui va être étudiée ici.

Soit les noms de nombre en français, en italien et en espagnol. On a une série :

FRANÇAIS
ITALIEN
ESPAGNOL
un, une uno, una uno, una
deux due dos
trois tre tres
quatre quattro cuatro
cinq cinque cinco
six sei seis
sept sette siete
huit otto ocho
neuf nove nueve
dix dieci diez
vingt venti veinte
trente trenta treinta
quarante quaranta cuarenta
cent cento ciento

De pareilles concordances ne sauraient être accidentelles ; elles le sont d’autant moins que les différences d’une langue à l’autre se laissent ramener à des règles de correspondance définies : ainsi la différence entre huit, otto et ocho est grande au premier abord ; mais le fait qu’elle n’est pas accidentelle résulte de ce qu’il y a une série de correspondances semblables, ainsi fr. nuit, it. notte, esp. noche, ou fr. cuit, it. cotto ; et l’on a de même fr. lait, it. latte, esp. leche ; fr. fait, it. fatto, esp. hecho ; etc. Les concordances évidentes dès l’abord montrent la voie à suivre. Mais ce sont les règles de correspondances phonétiques qui seules permettent d’en tirer parti.

Là où les ressemblances visibles ont indiqué la bonne voie, il arrive souvent que tel détail singulier apporte une confirmation. Il est significatif par exemple qu’il y ait une distinction du masculin et du féminin pour un, une et pas pour les autres nombres.

On est donc conduit à poser que les noms de nombre du français, de l’italien et de l’espagnol remontent à une seule et même tradition originelle. En pareil cas, l’expérience montre qu’il y a deux types de tradition possibles : les trois groupes considérés peuvent remonter à une origine commune, ou bien deux des trois peuvent avoir emprunté les formes de l’autre. En l’espèce, la seconde hypothèse est exclue, parce qu’on ne saurait expliquer les formes d’aucune des trois langues par celles d’une autre. Ni le fr. huit ne peut sortir de it. otto ou de esp. ocho, ni it. otto de fr. huit ou de esp. ocho, ni esp. ocho de fr. huit ou de it. otto. Il est prouvé ainsi que les noms de nombre du français, de l’italien et de l’espagnol ont un point de départ commun qui n’est ni français, ni italien, ni espagnol.

Dans l’exemple choisi, les concordances sont si nombreuses, si complètes et les règles de correspondances si faciles à reconnaître, qu’elles sont propres à frapper immédiatement des profanes et qu’il n’y a pas besoin d’être linguiste pour en apercevoir la valeur probante. Les concordances sont moins frappantes et les règles de correspondances plus difficiles à déterminer si l’on observe des langues séparées par de plus grands intervalles dans l’espace et dans le temps, comme le sanskrit, le grec attique ancien, le latin et l’arménien classique :

SKR.
GR. ATT.
« un » ékaḥ, ékā, ékam hēs, mia, hen

LAT.
ARM.
ūnus, ūna, ūnum mi

[là où il y a trois formes, l’une est celle du masculin, la seconde celle du féminin, la troisième celle du neutre ; l’arménien n’a pas de différences de genre grammatical.]

SKR.
GR.
LAT.
ARM.
« deux » d(u)vā dyo duo erku

[on ne note ici que les formes du masculin, là où le genre est distingué ; de même pour « trois » et pour « quatre ».]

SKR.
GR.
LAT.
ARM.
« trois » tráyaḥ trēs trēs erek‘
« quatre » catvā́raḥ téttares quattuor č̣ork‘
« cinq » páñca pénte quinque hing
« six » ṣáṭ heks sex vec̣
« sept » saptá heptá septem ewt‘n
« huit » áṣṭā[1] óktō octō ut‘n
« neuf » náva ennéa novem inn
« dix » dáça déka decem tasn

Si, réserve faite du nom de nombre « un », les correspondances entre le grec, le latin et même le sanskrit sont évidentes dans une large mesure, il n’en va pas de même de celles entre l’arménien et les autres langues.

Mais il suffit d’examiner les faits arméniens de près pour que la valeur probante des concordances ressorte.

Ainsi arm. erku « deux » ne ressemble pas à lat. duo, etc. ; mais d’autres correspondances montrent que erk- peut répondre à *dw- d’autres langues ; ainsi, de même que le grec a pour l’idée de « craindre » une racine dwi-, l’arménien a erki- (erkiwł « crainte »), et de même que le grec a pour dire « longtemps » un vieil adjectif dwārón, l’arménien a erkar « long » (v. ci-dessous, p. 31. La concordance se laisse donc ramener à une règle générale de correspondance : un ancien dw- aboutit à arm. erk-).

Au premier terme des composés, le grec a dwi-, et l’arménien erki-. Il y a donc un groupe de concordances singulières qui ne laisse aucun doute (voir ci-dessous, p. 107).

Les formes arméniennes erek‘ et č̣ork‘ sont loin de gr. trēs, téttares ; mais elles se laissent, au moins en partie, expliquer par des correspondances semblables. Et, détail caractéristique, de même qu’en sanskrit et en grec, « trois » et « quatre » ont des formes casuelles d’un type ordinaire, les noms à partir de « cinq » sont invariables ; or, en arménien, « trois » et « quatre » ont des formes casuelles normales, et, en particulier, le -k‘ final est la marque du nominatif pluriel arménien, marque qui ne se retrouve pas aux autres cas.

Moins apparentes au premier coup d’œil que les concordances entre le français, l’italien et l’espagnol, les concordances des formes des noms de nombre en sanskrit, en grec, en latin et en arménien ne sont au fond pas moins certaines, on le voit.

Ces concordances, qui ne peuvent s’expliquer par des emprunts d’une langue à l’autre, supposent une origine commune. Mais il reste à les interpréter d’une manière systématique : tel est l’objet de la linguistique historique comparative.


Le procédé dont on vient de voir le principe peut sembler compliqué, difficile à manier. Mais il n’y en a aucun autre pour faire l’histoire des langues.

Car l’histoire des langues ne se fait jamais au moyen d’une suite de textes rangés en ordre chronologique. Si le linguiste se sert de textes anciens, ce n’est que pour y observer des états de langue. Il va de soi que, pour toutes les langues anciennes, les faits se laissent observer seulement à l’aide des textes. C’est sur des documents écrits qu’on observe l’attique ou le gotique, l’arménien classique ou le vieux slave. Interprétés avec critique, ces documents donnent beaucoup, et l’on peut souvent avoir une notion précise de certains états de langue anciens. Mais cette étude permet seulement de déterminer l’état d’une langue à un certain moment, dans certaines conditions. L’examen des textes n’est qu’un substitut de l’observation directe devenue impossible.

Même dans les meilleurs cas, la langue écrite est bien loin d’enregistrer exactement les changements successifs de la langue parlée. Souvent la langue écrite est fixée, et la forme qu’elle présente ne change presque pas d’un siècle à l’autre. Là même où elle n’est pas entièrement fixée, l’usage écrit est ordinairement dominé, dans une large mesure, par des formes antérieures — qui ne sont pas toujours connues.

Soit l’exemple classique du latin. Entre la langue écrite telle qu’on la trouve chez Plaute et celle qu’on trouve chez saint Augustin, il y a des différences de détail ; mais la graphie ne varie presque pas ; les formes grammaticales et le principal du vocabulaire demeurent les mêmes. Les philologues se sont donné beaucoup de mal pour trouver des différences entre les périodes du latin à date historique. Ils ont apporté à ces recherches toute la minutieuse précision qu’y peut mettre un grammairien. Et ils ont constaté en effet de menues différences ; mais, pour une assez large part, ces différences tiennent au genre littéraire : la comédie de Plaute, destinée au gros public, n’est pas comparable aux discours de Cicéron ni aux bulletins du puriste qu’était César. La langue de la poésie hellénisante n’est pas celle de la prose. Il y a aussi des différences d’un écrivain à l’autre. Mais, au fond, il n’a jamais été écrit et enseigné à l’école qu’un seul latin.

Du reste, entre les formes que livrent les textes écrits, seule la comparaison indique celles qui ont une valeur pour l’histoire ultérieure de la langue. Pour désigner l’ « oreille », on trouve dans les textes écrits du latin auris, et aussi le dérivé auricula. Rien, dans les anciens textes latins, n’avertit que l’une ou l’autre de ces formes doive prévaloir sur l’autre ; auris est la forme courante. Or, c’est sur auricula que reposent les formes des langues romanes : fr. oreille, it. orecchia, esp. oreja. Seule, la comparaison du français, de l’italien, de l’espagnol, etc. renseigne sur la forme qui sert de base aux langues romanes.

D’autre part, la langue qui a survécu n’est pas celle qui s’écrivait. Entre le latin littéraire, qui est conservé par les textes des écrivains, et le latin parlé, que continuent les langues romanes, il y avait des différences, variables suivant les individus et suivant leur degré de culture. Or, les langues romanes ne continuent pas le latin littéraire. La « bouche » se nommait en latin écrit ōs ; mais ce qui a subsisté, c’est le nom vulgaire bucca. Et ainsi dans une foule de cas.

Là même où des textes d’époques diverses fournissent des états de langue successifs, on n’observe pas une continuité. Les changements essentiels auxquels est dû le passage du type latin ancien au type roman ont eu lieu entre le latin écrit et les premiers monuments des langues romanes. Sans doute les gens qui ont écrit le latin du iiie au xe siècle ap. J. C. ont laissé échapper bien des formes qui ne sont pas correctes en latin ancien et qui sont dues à la langue déjà toute différente qu’ils parlaient ; mais on ne peut apprécier la valeur de ces lapsus et y reconnaître des témoignages linguistiques que grâce à la connaissance des langues romanes. Les textes latins écrits depuis l’époque impériale jusqu’à l’époque carolingienne par des gens assez peu lettrés pour laisser échapper des fautes contre l’usage classique apportent des précisions, notamment dans la chronologie des faits, à la grammaire comparée des langues romanes ; mais, si les lumières qu’ils projettent sont précieuses, c’est pour éclairer la comparaison ; la comparaison venant à manquer, elles se perdraient dans le vide. Si les langues romanes étaient mortes avant d’avoir été notées, on apercevrait que le latin classique se corrompait ; mais on ne pourrait faire aucune théorie précise et complète des changements accomplis. Tout l’essentiel des changements linguistiques a lieu hors de notre vue.

L’histoire du perse fournit un exemple plus remarquable encore. On connaît — d’une manière très incomplète, il est vrai — le perse à l’époque de Darius et de Xerxès, grâce aux inscriptions monumentales de ces rois. Puis les témoignages manquent du ve siècle av. J.-C. jusqu’au iiie siècle ap. J.-C. Alors on trouve le « pehlvi. »

Mais, d’abord, ce pehlvi n’est pas, comme on l’a cru jusqu’aux dernières années, la continuation du parler qui a été noté dans les inscriptions des souverains achéménides : ainsi que je l’ai indiqué moi-même et que M. Tedesco l’a démontré d’une manière plus précise et plus complète, le pehlvi des textes de l’époque sassanide, ancêtre du persan littéraire, présente quelques traits qui le distinguent du perse achéménide. On ne saurait donc dire que le linguiste possède ici la tradition d’une même langue ; il observe, à des dates différentes, deux parlers de types très voisins, mais non identiques.

En second lieu, entre le perse achéménide et le pehlvi sassanide, il y a une différence de développement aussi grande que celle qui sépare le latin ancien du roman. Entre les deux dates, la langue a changé de caractère. Comme sur le domaine latin, l’essentiel du changement s’est passé hors de la vue de l’historien. Le linguiste dispose de deux états de langue profondément distincts l’un de l’autre ; pour faire une histoire, il lui faut restituer l’entre-deux. La comparaison des divers parlers iraniens modernes aide à faire cette restitution ; mais elle ne fournit que des directions, non des témoignages positifs.

D’une manière générale, l’histoire des langues ne se fait donc qu’en comparant des états de langue les uns aux autres. Car les faits que fournit la succession des textes dans les cas exceptionnels où les gens qui écrivent ont suivi plus ou moins complètement l’usage de la langue parlée en leur temps sont presque toujours d’importance médiocre, le plus souvent insignifiants, par rapport aux grands faits qui ont eu lieu sans avoir été notés par personne. Pour déterminer les états de langue du passé, le linguiste doit se servir de la philologie la plus exacte, la plus précise : et chaque progrès dans la précision philologique permet un progrès nouveau pour le linguiste. Le contact de plus en plus étroit qui s’est heureusement établi entre philologues et comparatistes est nécessaire pour que le linguiste puisse utiliser tous les faits, des faits certains, et des faits observés avec la dernière précision. Mais, à elle seule, la philologie n’apporte même pas un commencement d’histoire linguistique.

La comparaison est le seul instrument efficace dont dispose le linguiste pour faire l’histoire des langues. On observe les résultats des changements, non les changements eux-mêmes. C’est donc seulement à l’aide de combinaisons qu’on suit — et qu’on peut suivre — le développement des langues.


Mais ces combinaisons sont, on le verra, rigoureuses et précises. Toutes reposent sur l’affirmation que certaines concordances données entre langues diverses ne s’expliquent pas par des traits communs à tous les hommes et requièrent l’hypothèse d’une tradition particulière.

Telle est l’essence de la méthode comparative. Pour apprécier la valeur probante d’une combinaison, il n’y a qu’à ne jamais perdre de vue ce caractère de la preuve.


  1. Forme védique devant consonne, alternant avec áṣṭāv devant voyelle.