Cours de linguistique générale/Cinquième partie

Cours de linguistique générale (1916)

Texte établi par Charles Bally, Albert Sechehaye et Albert Riedlinger, Payot, 1971 (p. 291-317).

◄ QUATRIÈME PARTIE
LINGUISTIQUE GÉOGRAPHIQUE

bookCours de linguistique générale (1916)Ferdinand de SaussurePayot1971ParisVSaussure - Cours de linguistique générale, éd. Bally et Sechehaye, 1971.djvuSaussure - Cours de linguistique générale, éd. Bally et Sechehaye, 1971.djvu/6291-317

Cinquième partie

Questions de linguistique rétrospective
Conclusion

Chapitre premier

Les deux perspectives de la linguistique diachronique

Tandis que la linguistique synchronique n’admet qu’une seule perspective, celle des sujets parlants, et par conséquent une seule méthode, la linguistique diachronique suppose à la fois une perspective prospective, qui suit le cours du temps, et une perspective rétrospective, qui le remonte (voir p. 128).

La première correspond à la marche véritable des événements ; c’est celle qu’on emploie nécessairement pour écrire un chapitre quelconque de linguistique historique, pour développer n’importe quel point de l’histoire d’une langue. La méthode consiste uniquement à contrôler les documents dont on dispose. Mais dans une foule de cas cette manière de pratiquer la linguistique diachronique est insuffisante ou inapplicable.

En effet, pour pouvoir fixer l’histoire d’une langue dans tous ses détails en suivant le cours du temps, il faudrait posséder une infinité de photographies de la langue, prises de moment en moment. Or cette condition n’est jamais remplie : les romanistes, par exemple, qui ont le privilège de connaître le latin, point de départ de leur recherche, et de posséder une masse imposante de documents appartenant à une longue série de siècles, constatent à chaque instant les lacunes énormes de leur documentation. Il faut alors renoncer à la méthode prospective, au document direct, et procéder en sens inverse, en remontant le cours du temps par la rétrospection. Dans cette seconde vue on se place à une époque donnée pour rechercher, non pas ce qui résulte d’une forme, mais quelle est la forme plus ancienne qui a pu lui donner naissance.

Tandis que la prospection revient à une simple narration et se fonde tout entière sur la critique des documents, la rétrospection demande une méthode reconstructive, qui s’appuie sur la comparaison. On ne peut établir la forme primitive d’un signe unique et isolé, tandis que deux signes différents mais de même origine, comme latin pater, sanscrit pitar-, ou le radical de latin ger-ō et celui de ges-tus, font déjà entrevoir par leur comparaison l’unité diachronique qui les relie l’une et l’autre à un prototype susceptible d’être reconstitué par induction. Plus les termes de comparaison seront nombreux, plus ces inductions seront précises, et elles aboutiront — si les données sont suffisantes — à de véritables reconstructions.

Il en est de même pour les langues dans leur ensemble. On ne peut rien tirer du basque parce que, étant isolé, il ne se prête à aucune comparaison. Mais d’un faisceau de langues apparentées, comme le grec, le latin, le vieux slave, etc., a on pu par comparaison dégager les éléments primitifs communs qu’elles contiennent et reconstituer l’essentiel de la langue indo-européenne, telle qu’elle existait avant d’être différenciée dans l’espace. Et ce qu’on a fait en grand pour la famille tout entière, on l’a répété dans des proportions plus restreintes, — et toujours par le même procédé, — pour chacune de ses parties, partout où cela a été nécessaire et possible. Si par exemple de nombreux idiomes germaniques sont attestés directement par des documents, le germanique commun d’où ces divers idiomes sont sortis ne nous est connu qu’indirectement par la méthode rétrospective. C’est de la même manière encore que les linguistes ont recherché, avec des succès divers, l’unité primitive des autres familles (voir p. 263).

La méthode rétrospective nous fait donc pénétrer. dans le passé d’une langue au delà des plus anciens documents. Ainsi l’histoire prospective du latin ne commence guère qu’au iii^e ou au iv^e siècle avant l’ère chrétienne ; mais la reconstitution de l’indo-européen a permis de se faire une idée de ce qui a dû se passer dans la période qui s’étend entre l’unité primitive et les premiers documents latins connus, et ce n’est qu’après coup qu’on a pu en tracer le tableau prospectif.

Sous ce rapport, la linguistique évolutive est comparable à la géologie, qui, elle aussi, est une science historique ; il lui arrive de décrire des états stables (par exemple l’état actuel du bassin du Léman), en faisant abstraction de ce qui a pu précéder dans le temps, mais elle s’occupe surtout d’événements, de transformations, dont l’enchaînement forme des diachronies. Or en théorie on peut concevoir une géologie prospective, mais en fait et le plus souvent, le coup d’œil ne peut être que rétrospectif ; avant de raconter ce qui s’est passé sur un point de la terre, on est obligé de reconstruire la chaîne des événements et de rechercher ce qui a amené cette partie du globe à son état actuel.

Ce n’est pas seulement la méthode des deux perspectives qui diffère de façon éclatante ; même au point de vue didactique, il n’est pas avantageux de les employer simultanément dans un même exposé. Ainsi l’étude des changements phonétiques offre deux tableaux très différents selon que l’on procède de l’une ou de l’autre manière. En opérant prospectivement, on se demandera ce qu’est devenu en français le ĕ du latin classique ; on verra alors un son unique se diversifier en évoluant dans le temps et donner naissance à plusieurs phonèmes : cf. pĕdem → pye (pied), vĕntum → vã (vent), lĕctum → li (lit), nĕcāre → nwayẹ (noyer), etc. ; si l’on recherche, au contraire, rétrospectivement ce que représente en latin un ę ouvert français, on constatera qu’un son unique est l’aboutissement de plusieurs phonèmes distincts à l’origine : cf. tęr (terre) = tĕrram, vęrž (verge) = vĭrgam, fę (fait) = factum, etc. L’évolution des éléments formatifs pourrait être présentée également de deux manières, et les deux tableaux seraient aussi différents ; tout ce que nous avons dit p. 232 sv. des formations analogiques le prouve a priori. Si l’on recherche par exemple (rétrospectivement) les origines du suffixe de participe français en -é, on remonte au latin -ātum ; celui-ci, par ses origines, se rattache d’abord aux verbes dénominatifs latins en -āre, qui eux-mêmes remontent en grande partie aux substantifs féminins en -a (cf. plantāre : planta, grec tīmáō : tīmā́, etc.) ; d’autre part, -ātum n’existerait pas si le suffixe indo-européen -to- n’avait pas été par lui-même vivant et productif (cf. grec klu-tó-s, latin in-clu-tu-s, sanscrit çru-ta-s, etc.) ; -ātum renferme encore l’élément formatif -m de l’accusatif singulier (voir p. 212). Si, inversement, on se demande (prospectivement) dans quelles formations françaises se retrouve le suffixe primitif -to-, on pourrait mentionner non seulement les divers suffixes, productifs ou non, du participe passé (aimé = latin amātum, fini = latin fīnītum, clos = latin clausum pour *claudtum, etc.), mais encore bien d’autres, comme -u = latin -ūtum (cf. cornu = cornūtum), -tif (suffixe savant) = latin -tīvum (cf. fugitif = fugitīvum, sensitif, négatif, etc.), et une quantité de mots qu’on n’analyse plus, tels que point = latin punctum, dé = latin datum, chétif = latin captīvum, etc.

Chapitre II

La langue la plus ancienne et le prototype

À ses premiers débuts, la linguistique indo-européenne n’a pas compris le vrai but de la comparaison, ni l’importance de la méthode reconstitutive (voir p. 16). C’est ce qui explique une de ses erreurs les plus frappantes : le rôle exagéré et presque exclusif qu’elle accorde au sanscrit dans la comparaison ; comme c’est le plus ancien document de l’indo-européen, ce document a été promu à la dignité de prototype. Autre chose est de supposer l’indo-européen engendrant le sanscrit, le grec, le slave, le celtique, l’italique, autre chose est de mettre l’une de ces langues à la place de l’indo-européen. Cette confusion grossière a eu des conséquences aussi diverses que profondes. Sans doute cette hypothèse n’a jamais été formulée aussi catégoriquement que nous venons de le faire, mais en pratique on l’admettait tacitement. Bopp écrivait qu’ « il ne croyait pas que le sanscrit pût être la source commune », comme s’il était possible de formuler, même dubitativement, une semblable supposition.

Ceci amène à se demander ce qu’on veut dire quand on parle d’une langue qui serait plus ancienne ou plus vieille qu’une autre. Trois interprétations sont possibles, en théorie :

1^o On peut d’abord penser à l’origine première, au point de départ d’une langue ; mais le plus simple raisonnement montre qu’il n’y en a aucune à laquelle on puisse assigner un âge, parce que n’importe laquelle est la continuation de ce qui se parlait avant elle. Il n’en est pas du langage comme de l’humanité : la continuité absolue de son développement empêche d’y distinguer des générations, et Gaston Paris s’élevait avec raison contre la conception de langues filles et de langues mères, parce qu’elle suppose des interruptions. Ce n’est donc pas dans ce sens qu’on peut dire qu’une langue est plus vieille qu’une autre.

2^o On peut aussi donner à entendre qu’un état de langue a été surpris à une époque plus ancienne qu’une autre : ainsi le perse des inscriptions achéménides est plus ancien que le persan de Firdousi. Tant qu’il s’agit, comme dans ce cas particulier, de deux idiomes positivement issus l’un de l’autre et également bien connus, il va sans dire que le plus ancien doit seul entrer en ligne de compte. Mais si ces deux conditions ne sont pas remplies, cette ancienneté-là n’a aucune importance ; ainsi le lituanien, attesté depuis 1540 seulement, n’est pas moins précieux à cet égard que le paléoslave, consigné au x^e siècle, ou même que le sanscrit du Rigvéda.

3^o Le mot « ancien » peut désigner enfin un état de langue plus archaïque, c’est-à-dire dont les formes sont restées plus près du modèle primitif, en dehors de toute question de date. Dans ce sens, on pourrait dire que le lituanien du xvi^e siècle est plus ancien que le latin du iii^e siècle avant l’ère.

Si l’on attribue au sanscrit une plus grande ancienneté qu’à d’autres langues, cela ne peut donc être que dans le deuxième ou le troisième sens ; or il se trouve qu’il l’est dans l’un comme dans l’autre. D’une part, on accorde que les hymnes védiques dépassent en antiquité les textes grecs les plus anciens ; d’autre part, chose qui importe particulièrement, la somme de ses caractères archaïques est considérable en comparaison de ce que d’autres langues ont conservé (voir p. 15).

Par suite de cette idée assez confuse d’antiquité qui fait du sanscrit quelque chose d’antérieur à toute la famille, il arriva plus tard que les linguistes, même guéris de l’idée qu’il est une langue mère, continuèrent à donner une importance trop grande au témoignage qu’il fournit comme langue collatérale.

Dans ses Origines indo-européennes (voir p. 306), Ad. Pictet, tout en reconnaissant explicitement l’existence d’un peuple primitif qui parlait sa langue à lui, n’en reste pas moins convaincu qu’il faut consulter avant tout le sanscrit, et que son témoignage surpasse en valeur celui de plusieurs autres langues indo-européennes réunies. C’est cette illusion qui a obscurci pendant de longues années des questions de première importance, comme celle du vocalisme primitif.

Cette erreur s’est répétée en petit et en détail. En étudiant des rameaux particuliers de l’indo-européen on était porté à voir dans l’idiome le plus anciennement connu le représentant adéquat et suffisant du groupe entier, sans chercher à mieux connaître l’état primitif commun. Par exemple, au lieu de parler de germanique, on ne se faisait pas scrupule de citer tout simplement le gotique, parce qu’il est antérieur de plusieurs siècles aux autres dialectes germaniques ; il devenait par usurpation le prototype, la source des autres dialectes. Pour le slave, on se fondait exclusivement sur le slavon ou paléoslave, connu au x^e siècle, parce que les autres sont connus à date plus basse.

En fait il est extrêmement rare que deux formes de langue fixées par l’écriture à des dates successives se trouvent représenter exactement le même idiome à deux moments de son histoire. Le plus souvent on est en présence de deux dialectes qui ne sont pas la suite linguistique l’un de l’autre. Les exceptions confirment la règle : la plus illustre est celle des langues romanes vis-à-vis du latin : en remontant du français au latin, on se trouve bien dans la verticale ; le territoire de ces langues se trouve être par hasard le même que celui où l’on parlait latin, et chacune d’elles n’est que du latin évolué. De même nous avons vu que le perse des inscriptions de Darius est le même dialecte que le persan du moyen âge. Mais l’inverse est beaucoup plus fréquent : les témoignages des diverses époques appartiennent à des dialectes différents de la même famille. Ainsi le germanique s’offre successivement dans le gotique d’Ulfilas, dont on ne connaît pas la suite, puis dans les textes du vieux haut allemand, plus tard dans ceux de l’anglo-saxon, du norrois, etc. ; or aucun de ces dialectes ou groupes de dialectes n’est la continuation de celui qui est attesté antérieurement. Cet état de choses peut être figuré par le schéma suivant, où les lettres représentent les dialectes et les lignes pointillées les époques successives :

.

A

.

Époque 1

.

B

.

|

.

Époque 2

.

C

.

{\Bigg \downarrow }

.

D

.

{\Bigg \downarrow }

.

Époque 3

.

\downarrow

.

\downarrow

.

E

.

Époque 4

La linguistique n’a qu’à se féliciter de cet état de choses ; autrement le premier dialecte connu (A) contiendrait d’avance tout ce qu’on pourrait déduire de l’analyse des états subséquents, tandis qu’en cherchant le point de convergence de tous ces dialectes (A, B, C, D, etc.), on rencontrera une forme plus ancienne que A, soit un prototype X, et la confusion de A et de X sera impossible.

Chapitre III

Les reconstructions

§ 1.

Leur nature et leur but.

Si le seul moyen de reconstruire est de comparer, réciproquement la comparaison n’a pas d’autre but que d’être une reconstruction. Sous peine d’être stériles, les correspondances constatées entre plusieurs formes doivent être placées dans la perspective du temps et aboutir au rétablissement d’une forme unique ; nous avons insisté à plusieurs reprises sur ce point (p. 16 sv., 272). Ainsi pour expliquer le latin medius en face du grec mésos, il a fallu, sans remonter jusqu’à l’indo-européen, poser un terme plus ancien *methyos susceptible d’être relié historiquement à medius et à mésos. Si au lieu de comparer deux mots de langues différentes, on confronte deux formes prises dans une seule, la même constatation s’impose : ainsi en latin gerō et gestus font remonter à un radical *ges- jadis commun aux deux formes.

Remarquons en passant que la comparaison portant sur des changements phonétiques doit s’aider constamment de considérations morphologiques. Dans l’examen de latin patior et passus, je fais intervenir factus, dictus, etc., parce que passus est une formation de même nature ; c’est en me fondant sur le rapport morphologique entre faciō et factus, dīcō et dictus, etc., que je peux établir le même rapport à une époque antérieure entre patior et *pat-tus. Réciproquement, si la comparaison est morphologique, je dois l’éclairer par le secours de la phonétique : le latin meliōrem peut être comparé au grec hēdíō parce que phonétiquement l’un remonte à *meliosem, *meliosm et l’autre à *hādioa *hādiosa, *hādiosm.

La comparaison linguistique n’est donc pas une opération mécanique ; elle implique le rapprochement de toutes les données propres à fournir une explication. Mais elle devra toujours aboutir à une conjecture tenant dans une formule quelconque, et visant à rétablir quelque chose d’antérieur ; toujours la comparaison reviendra à une reconstruction de formes.

Mais la vue sur le passé vise-t-elle la reconstruction des formes complètes et concrètes de l’état antérieur ? Se borne-t-elle au contraire à des affirmations abstraites, partielles, portant sur les parties des mots, comme par exemple à cette constatation que le f latin dans fūmus correspond à un italique commun þ, ou que le premier élément du grec állo, latin aliud, était déjà en indo-européen un a ? Elle peut fort bien limiter sa tâche à ce second ordre de recherches ; on peut même dire que sa méthode analytique n’a pas d’autre but que ces constatations partielles. Seulement, de la somme de ces faits isolés, on peut tirer des conclusions plus générales : par exemple une série de faits analogues à celui du latin fūmus permet de poser avec certitude que þ figurait dans le système phonologique de l’italique commun ; de même, si l’on peut affirmer que l’indo-européen montre dans la flexion dite pronominale une terminaison de neutre singulier -d, différente de celle des adjectifs -m, c’est là un fait morphologique général déduit d’un ensemble de constatations isolées (cf. latin istud, aliud contre bonum, grec tó = *tod, állo = *allod contre kalón, angl. that, etc.). On peut aller plus loin : ces divers faits une fois reconstitués, on procède à la synthèse de tous ceux qui concernent une forme totale, pour reconstruire des mots complets (par exemple indo-europ. *alyod), des paradigmes de flexion, etc. Pour cela on réunit en un faisceau des affirmations parfaitement isolables ; si par exemple on compare les diverses parties d’une forme reconstruite comme *alyod, on remarque une grande différence entre le -d, qui soulève une question de grammaire, et a-, qui n’a aucune signification de ce genre. Une forme reconstruite n’est pas un tout solidaire, mais une somme toujours décomposable de raisonnements phonétiques, et chacune de ses parties est révocable et reste soumise à l’examen. Aussi les formes restituées ont-elles toujours été le reflet fidèle des conclusions générales qui leur sont applicables. L’indo-européen pour « cheval » a été supposé successivement *akvas, *ak₁vas, *ek₁vos, enfin *ek₁wos ; seul s est resté incontesté, ainsi que le nombre des phonèmes.

Le but des reconstructions n’est donc pas de restituer une forme pour elle-même, ce qui serait d’ailleurs assez ridicule, mais de cristalliser, de condenser un ensemble de conclusions que l’on croit justes, d’après les résultats qu’on a pu obtenir à chaque moment ; en un mot, d’enregistrer les progrès de notre science. On n’a pas à justifier les linguistes de l’idée assez bizarre qu’on leur prête de restaurer de pied en cap l’indo-européen, comme s’ils voulaient en faire usage. Ils n’ont pas même cette vue quand ils abordent les langues connues historiquement (on n’étudie pas le latin linguistiquement pour le bien parler), à plus forte raison pour les mots séparés de langues préhistoriques.

D’ailleurs, même si la reconstruction restait sujette à revision, on ne saurait s’en passer pour avoir une vue sur l’ensemble de la langue étudiée, sur le type linguistique auquel elle appartient. C’est un instrument indispensable pour représenter avec une relative facilité une foule de faits généraux, synchroniques et diachroniques. Les grandes lignes de l’indo-européen s’éclairent immédiatement par l’ensemble des reconstructions : par exemple, que les suffixes étaient formés de certains éléments (t, s, r, etc.) à l’exclusion d’autres, que la variété compliquée du vocalisme des verbes allemands (cf. werden, wirst, ward, wurde, worden) cache dans la règle une même alternance primitive : e—o—zéro. Par contre-coup l’histoire des périodes ultérieures s’en trouve grandement facilitée : sans reconstruction préalable, il serait bien plus difficile d’expliquer les changements survenus au cours du temps depuis la période antéhistorique.

§ 2.

Degré de certitude des reconstitutions.

Il y a des formes reconstruites qui sont tout à fait certaines, d’autres qui restent contestables ou franchement problématiques. Or, comme on vient de le voir, le degré de certitude des formes totales dépend de la certitude relative qu’on peut attribuer aux restitutions partielles qui interviennent dans cette synthèse. À cet égard, deux mots ne sont presque jamais sur le même pied ; entre des formes indo-européennes aussi lumineuses que *esti « il est » et *didōti « il donne », il y a une différence ; car dans la seconde la voyelle de redoublement permet un doute (cf. sanscrit dadāti et grec dídōsi).

En général on est porté à croire les reconstitutions moins sûres qu’elles ne le sont. Trois faits sont propres à augmenter notre confiance :

Le premier, qui est capital, a été signalé p. 65 sv. : un mot étant donné, on peut distinguer nettement les sons qui le composent, leur nombre et leur délimitation ; on a vu, p. 83, ce qu’il faut penser des objections que feraient certains linguistes penchés sur le microscope phonologique. Dans un groupe tel que -sn- il y a sans doute des sons furtifs ou de transition ; mais il est antilinguistique d’en tenir compte ; l’oreille ordinaire ne les distingue pas, et surtout les sujets parlants sont toujours d’accord sur le nombre des éléments. Aussi pouvons-nous dire que dans la forme indo-européenne *ek₁wos il n’y avait que cinq éléments distincts, différentiels, auxquels les sujets devaient faire attention.

Le second fait concerne le système de ces éléments phonologiques dans chaque langue. Tout idiome opère avec une gamme de phonèmes dont le total est parfaitement délimité (voir p. 58). Or, en indo-européen, tous les éléments du système apparaissent au moins dans une douzaine de formes attestées par reconstruction, quelquefois dans des milliers. On est donc sûr de les connaître tous.

Enfin, pour connaître les unités phoniques d’une langue il n’est pas indispensable de caractériser leur qualité positive ; il faut les considérer comme des entités différentielles dont le propre est de ne pas se confondre les unes avec les autres (voir p. 164). Cela est si bien l’essentiel qu’on pourrait désigner les éléments phoniques d’un idiome à reconstituer par des chiffres ou des signes quelconques. Dans *ĕk₁wŏs, il est inutile de déterminer la qualité absolue de ĕ, de se demander s’il était ouvert ou fermé, articulé plus ou moins en avant, etc. ; tant qu’on n’aura pas reconnu plusieurs sortes de ĕ, cela reste sans importance, pourvu qu’on ne le confonde pas avec un autre des éléments distingués de la langue (ă, ŏ, ĕ, etc.). Cela revient à dire que le premier phonème de *ĕk₁wŏs ne différait pas du second de *mĕdhyŏs, du troisième de *ăgĕ, etc., et qu’on pourrait, sans spécifier sa nature phonique, le cataloguer et le représenter par son numéro dans le tableau des phonèmes indo-européens. Ainsi la reconstruction de *ĕk₁wŏs veut dire que le correspondant indo-européen de latin equos, sanscrit açva-s, etc., était formé de cinq phonèmes déterminés pris dans la gamme phonologique de l’idiome primitif.

Dans les limites que nous venons de tracer, nos reconstitutions conservent donc leur pleine valeur.

Chapitre IV

Le témoignage de la langue en anthropologie et en préhistoire

§ 1.

Langue et race.

Le linguiste peut donc, grâce à la méthode rétrospective, remonter le cours des siècles et reconstituer des langues parlées par certains peuples bien avant leur entrée dans l’histoire. Mais ces reconstructions ne pourraient-elles pas nous renseigner en outre sur ces peuples eux-mêmes, leur race, leur filiation, leurs rapports sociaux, leurs mœurs, leurs institutions, etc. ? En un mot, la langue apporte-t-elle des lumières à l’anthropologie, à l’ethnographie, à la préhistoire ? On le croit très généralement ; nous pensons qu’il y a là une grande part d’illusion. Examinons brièvement quelques aspects de ce problème général.

D’abord la race : ce serait une erreur de croire que de la communauté de langue on peut conclure à la consanguinité, qu’une famille de langues recouvre une famille anthropologique. La réalité n’est pas si simple. Il y a par exemple une race germanique, dont les caractères anthropologiques sont très nets : chevelure blonde, crâne allongé, stature élevée, etc. ; le type Scandinave en est la forme la plus parfaite. Pourtant il s’en faut que toutes les populations parlant des langues germaniques répondent à ce signalement ; ainsi les Alémanes, au pied des Alpes, ont un type anthropologique bien différent de celui des Scandinaves. Pourrait-on admettre du moins qu’un idiome appartient en propre à une race et que, s’il est parlé par des peuples allogènes, c’est qu’il leur a été imposé par la conquête ? Sans doute, on voit souvent des nations adopter ou subir la langue de leurs vainqueurs, comme les Gaulois après la victoire des Romains ; mais cela n’explique pas tout : dans le cas des Germains, par exemple, même en admettant qu’ils aient subjugué tant de populations diverses, ils ne peuvent pas les avoir toutes absorbées ; pour cela il faudrait supposer une longue domination préhistorique, et d’autres circonstances encore que rien n’établit.

Ainsi la consanguinité et la communauté linguistique semblent n’avoir aucun rapport nécessaire, et il est impossible de conclure de l’une à l’autre ; par conséquent, dans les cas très nombreux où les témoignages de l’anthropologie et de la langue ne concordent pas, il n’est pas nécessaire de les opposer ni de choisir entre eux ; chacun d’eux garde sa valeur propre.

§ 2.

Ethnisme.

Que nous apprend donc ce témoignage de la langue ? L’unité de race ne peut être, en elle-même, qu’un facteur secondaire et nullement nécessaire de communauté linguistique ; mais il y a une autre unité, infiniment plus importante, la seule essentielle, celle qui est constituée par le lien social : nous l’appellerons ethnisme. Entendons par là une unité reposant sur des rapports multiples de religion, de civilisation, de défense commune, etc., qui peuvent s’établir même entre peuples de races différentes et en l’absence de tout lien politique.

C’est entre l’ethnisme et la langue que s’établit ce rapport de réciprocité déjà constaté p. 40 : le lien social tend à créer la communauté de langue et imprime peut-être à l’idiome commun certains caractères ; inversement, c’est la communauté de langue qui constitue, dans une certaine mesure, l’unité ethnique. En général celle-ci suffit toujours pour expliquer la communauté linguistique. Par exemple, au début du moyen âge il y a eu un ethnisme roman reliant, sans lien politique, des peuples d’origines très diverses. Réciproquement, sur la question de l’unité ethnique, c’est avant tout la langue qu’il faut interroger ; son témoignage prime tous les autres. En voici un exemple : dans l’Italie ancienne, on trouve les Étrusques à côté des Latins ; si l’on cherche ce qu’ils ont de commun, dans l’espoir de les ramener à une même origine, on peut faire appel à tout ce que ces deux peuples ont laissé : monuments, rites religieux, institutions politiques, etc. ; mais on n’arrivera jamais à la certitude que donne immédiatement la langue : quatre lignes d’étrusque suffisent pour nous montrer que le peuple qui le parlait était absolument distinct du groupe ehtnique qui parlait latin.

Ainsi, sous ce rapport et dans les limites indiquées, la langue est un document historique ; par exemple le fait que les langues indo-européennes forment une famille nous fait conclure à un ethnisme primitif, dont toutes les nations parlant aujourd’hui ces langues sont, par filiation sociale, les héritières plus ou moins directes.

§ 3.

Paléontologie linguistique.

Mais si la communauté de langue permet d’affirmer la communauté sociale, la langue nous fait-elle connaître la nature de cet ethnisme commun ?

Pendant longtemps on a cru que les langues sont une source inépuisable de documents sur les peuples qui les parlent et sur leur préhistoire. Adolphe Pictet, un des pionniers du celtisme, est surtout connu par son livre Les Origines indo-européennes (1859-63). Cet ouvrage a servi de modèle à beaucoup d’autres ; il est demeuré le plus attrayant de tous. Pictet veut retrouver dans les témoignages fournis par les langues indo-européennes les traits fondamentaux de la civilisation des « Aryâs », et il croit pouvoir en fixer les aspects les plus divers : choses matérielles (outils, armes, animaux domestiques), vie sociale (était-ce un peuple nomade ou agricole ?), famille, gouvernement ; il cherche à connaître le berceau des Aryâs, qu’il place en Bactriane ; il étudie la flore et la faune du pays qu’ils habitaient. C’est là l’essai le plus considérable qu’on ait fait dans cette direction ; la science ainsi inaugurée reçut le nom de paléontologie linguistique.

D’autres tentatives ont été faites depuis dans le même sens ; une des plus récentes est celle de Hermann Hirt (Die Indogermanen, 1905-1907)^[1]. Il s’est fondé sur la théorie de J. Schmidt (voir p. 287) pour déterminer la contrée habitée par les Indo-européens ; mais il ne dédaigne pas de recourir à la paléontologie linguistique : des faits de vocabulaire lui montrent que les Indo-européens étaient agriculteurs, et il refuse de les placer dans la Russie méridionale, comme plus propre à la vie nomade ; la fréquence des noms d’arbres, et surtout de certaines essences (sapin, bouleau, hêtre, chêne), lui donne à penser que leur pays était boisé et qu’il se trouvait entre le Harz et la Vistule, plus spécialement dans la région de Brandebourg et de Berlin. Rappelons aussi que, même avant Pictet, Adalbert Kuhn et d’autres avaient utilisé la linguistique pour reconstruire la mythologie et la religion des Indo-européens.

Or il ne semble pas qu’on puisse demander à une langue des renseignements de ce genre, et si elle ne peut les fournir, cela tient, selon nous, aux causes suivantes :

D’abord l’incertitude de l’étymologie ; on a compris peu à peu combien sont rares les mots dont l’origine est bien établie, et l’on est devenu plus circonspect. Voici un exemple des témérités d’autrefois : étant donnés servus et servāre, on les rapproche — on n’en a peut-être pas le droit ; puis on donne au premier la signification de « gardien », pour en conclure que l’esclave a été à l’origine le gardien de la maison. Or on ne peut pas même affirmer que servāre ait eu d’abord le sens de « garder ». Ce n’est pas tout : les sens des mots évoluent : la signification d’un mot change souvent en même temps qu’un peuple change de résidence. On a cru voir aussi dans l’absence d’un mot la preuve que la civilisation primitive ignorait la chose désignée par ce mot ; c’est une erreur. Ainsi le mot pour « labourer » manque dans les idiomes asiatiques ; mais cela ne signifie pas que cette occupation fût inconnue à l’origine : le labour a pu tout aussi bien tomber en désuétude ou se faire par d’autres procédés, désignés par d’autres mots.

La possibilité des emprunts est un troisième facteur qui trouble la certitude. Un mot peut passer après coup dans une langue en même temps qu’une chose est introduite chez le peuple qui la parle, ainsi le chanvre n’a été connu que très tard dans le bassin de la Méditerranée, plus tard encore dans les pays du Nord ; à chaque fois le nom du chanvre passait avec la plante. Dans bien des cas, l’absence de données extra-linguistiques ne permet pas de savoir si la présence d’un même mot dans plusieurs langues est due à l’emprunt ou prouve une tradition primitive commune.

Ce n’est pas à dire qu’on ne puisse dégager sans hésitation quelques traits généraux et même certaines données précises : ainsi les termes communs indiquant la parenté sont abondants et se sont transmis avec une grande netteté ; ils permettent d’affirmer que, chez les Indo-européens, la famille était une institution aussi complexe que régulière : car leur langue connaît en cette matière des nuances que nous ne pouvons rendre. Dans Homère eináteres veut dire « belles-sœurs » dans le sens de « femmes de plusieurs frères » et galóōi « belles-sœurs » dans le sens de « femme et sœur du mari entre elles » ; or le latin janitrīcēs correspond à eináteres pour la forme et la signification. De même le « beau-frère, mari de la sœur » ne porte pas le même nom que les « beaux-frères, maris de plusieurs sœurs entre eux ». Ici on peut donc vérifier un détail minutieux, mais en général on doit se contenter d’un renseignement général. Il en est de même des animaux : pour des espèces importantes comme l’espèce bovine, non seulement on peut tabler sur la coïncidence de grec boûs, all. Kuh, sanscrit gau-s etc., et reconstituer un indo-européen *g₁ōu-s, mais la flexion a les mêmes caractères dans toutes les langues, ce qui ne serait pas possible s’il s’agissait d’un mot emprunté postérieurement à une autre langue.

Qu’on nous permette d’ajouter ici, avec un peu plus de détails, un autre fait morphologique qui a ce double caractère d’être limité à une zone déterminée et de toucher à un point d’organisation sociale.

Malgré tout ce qui a été dit sur le lien de dominus avec domus, les linguistes ne se sentent pas pleinement satisfaits, parce qu’il est au plus haut point extraordinaire de voir un suffixe -no- former des dérivés secondaires ; on n’a jamais entendu parler d’une formation comme serait en grec *oiko-no-s ou *oike-no-s de oîkos, ou en sanscrit *açva-na- de açva-. Mais c’est précisément cette rareté qui donne au suffixe de dominus sa valeur et son relief. Plusieurs mots germaniques sont, selon nous, tout à fait révélateurs :

1^o *þeuđa-na-z « le chef de la *þeuđō, le roi », got. þiudans, vieux saxon thiodan (*þeuđō, got. þiuda, = osque touto « peuple »).

2^o *druᵪti-na-z (partiellement changé en *druᵪtī-na-z) « le chef de la *druᵪti-z, de l’armée », d’où le nom chrétien pour « le Seigneur, c’est-à-dire Dieu », v. norr. Dróttinn, anglo-saxon Dryhten, tous les deux avec la finale -ĭna-z.

3^o *kindi-na-z « le chef de la *kindi-z = lat. gens ». Comme le chef d’une gens était, par rapport à celui d’une *þeuđō, un vice-roi, ce terme germanique de kindins (absolument perdu par ailleurs) est employé par Ulfilas pour désigner le gouverneur romain d’une province, parce que le légat de l’empereur était, dans ses idées germaniques, la même chose qu’un chef de clan vis-à-vis d’un þiudans ; si intéressante que soit l’assimilation au point de vue historique, il n’est pas douteux que le mot kindins, étranger aux choses romaines, témoigne d’une division des populations germaniques en kindi-z.

Ainsi un suffixe secondaire -no- s’ajoute à n’importe quel thème en germanique pour donner le sens de « chef de telle ou telle communauté ». Il ne reste plus alors qu’à constater que latin tribūnus signifie de même littéralement « le chef de la tribus » comme þiudans le chef de la þiuda, et de même enfin domi-nus « chef de la domus », dernière division de la touta = þiuda. Dominus, avec son singulier suffixe, nous semble une preuve très difficilement réfutable non seulement d’une communauté linguistique mais aussi d’une communauté d’institutions entre l’ethnisme italiote et l’ethnisme germain.

Mais il faut se rappeler encore une fois que les rapprochements de langue à langue livrent rarement des indices aussi caractéristiques.

§ 4.

Type linguistique et mentalité du groupe social.

Si la langue ne fournit pas beaucoup de renseignements précis et authentiques sur les mœurs et les institutions du peuple qui en fait usage, sert-elle au moins à caractériser le type mental du groupe social qui la parle ? C’est une opinion assez généralement admise qu’une langue reflète le caractère psychologique d’une nation ; mais une objection très grave s’oppose à cette vue : un procédé linguistique n’est pas nécessairement déterminé par des causes psychiques.

Les langues sémitiques expriment le rapport de substantif déterminant à substantif déterminé (cf. franç. « la parole de Dieu »), par la simple juxtaposition, qui entraîne, il est vrai, une forme spéciale, dite « état construit », du déterminé placé devant le déterminant. Soit en hébreu dāƀār « parole » et ’elōhīm^[2] « Dieu : » dƀar, ’elōhīm signifie : « la parole de Dieu ». Dirons-nous que ce type syntaxique révèle quelque chose de la mentalité sémitique ? L’affirmation serait bien téméraire, puisque l’ancien français a régulièrement employé une construction analogue : cf. le cor Roland, les quatre fils Aymon, etc. Or ce procédé est né en roman d’un pur hasard, morphologique autant que phonétique : la réduction extrême des cas, qui a imposé à la langue cette construction nouvelle. Pourquoi un hasard analogue n’aurait-il pas jeté le protosémite dans la même voie ? Ainsi un fait syntaxique qui semble être un de ses traits indélébiles n’offre aucun indice certain de la mentalité sémite.

Autre exemple : l’indo-européen primitif ne connaissait pas de composés à premier élément verbal. Si l’allemand en possède (cf. Bethaus, Springbrunnen, etc.) faut-il croire qu’à un moment donné les Germains ont modifié un mode de pensée hérité de leurs ancêtres ? Nous avons vu que cette innovation est due à un hasard non seulement matériel, mais encore négatif : la suppression de l’a dans betahūs (voir p. 195). Tout s’est passé hors de l’esprit, dans la sphère des mutations de sons, qui bientôt imposent un joug absolu à la pensée et la forcent à entrer dans la voie spéciale qui lui est ouverte par l’état matériel des signes. Une foule d’observations du même genre nous confirment dans cette opinion ; le caractère psychologique du groupe linguistique pèse peu devant un fait comme la suppression d’une voyelle ou une modification d’accent, et bien d’autres choses analogues capables de révolutionner à chaque instant le rapport du signe et de l’idée dans n’importe quelle forme de langue.

Il n’est jamais sans intérêt de déterminer le type grammatical des langues (qu’elles soient historiquement connues ou reconstruites) et de les classer d’après les procédés qu’elles emploient pour l’expression de la pensée ; mais de ces déterminations et de ces classements on ne saurait rien conclure avec certitude en dehors du domaine proprement linguistique.

Chapitre V

Familles de langues et types linguistiques^[3]

Nous venons de voir que la langue n’est pas soumise directement à l’esprit des sujets parlants : insistons en terminant sur une des conséquences de ce principe : aucune famille de langues n’appartient de droit et une fois pour toutes à un type linguistique.

Demander à quel type un groupe de langues se rattache, c’est oublier que les langues évoluent ; c’est sous-entendre qu’il y aurait dans cette évolution un élément de stabilité. Au nom de quoi prétendrait-on imposer des limites à une action qui n’en connaît aucune ?

Beaucoup, il est vrai, en parlant des caractères d’une famille, pensent plutôt à ceux de l’idiome primitif, et ce problème-là n’est pas insoluble, puisqu’il s’agit d’une langue et d’une époque. Mais dès qu’on suppose des traits permanents auxquels le temps ni l’espace ne peuvent rien changer, on heurte de front les principes fondamentaux de la linguistique évolutive. Aucun caractère n’est permanent de droit ; il ne peut persister que par hasard.

Soit, par exemple, la famille indo-européenne ; on connaît les caractères distinctifs de la langue dont elle est issue ; le système des sons est d’une grande sobriété ; pas de groupes compliqués de consonnes, pas de consonnes doubles ; un vocalisme monotone, mais qui donne lieu à un jeu d’alternances extrêmement régulières et profondément grammaticales (voir pp. 216, 302) ; un accent de hauteur, qui peut se placer, en principe, sur n’importe quelle syllabe du mot et contribue par conséquent au jeu des oppositions grammaticales ; un rythme quantitatif, reposant uniquement sur l’opposition des syllabes longues et brèves ; une grande facilité pour former des composés et des dérivés ; la flexion nominale et verbale est très riche ; le mot fléchi, portant en lui-même ses déterminations, est autonome dans la phrase, d’où grande liberté de construction et rareté des mots grammaticaux à valeur déterminative ou relationnelle (préverbes, prépositions, etc.).

Or on voit aisément qu’aucun de ces caractères ne s’est maintenu intégralement dans les diverses langues indo-européennes, que plusieurs (par exemple le rôle du rythme quantitatif et de l’accent de hauteur) ne se retrouvent dans aucune ; certaines d’entre elles ont même altéré l’aspect primitif de l’indo-européen au point de faire penser à un type linguistique entièrement différent, par exemple l’anglais, l’arménien, l’irlandais, etc.

Il serait plus légitime de parler de certaines transformations plus ou moins communes aux diverses langues d’une famille. Ainsi l’affaiblissement progressif du mécanisme flexionnel, signalé plus haut, est général dans les langues indo-européennes, bien qu’elles présentent sous ce rapport même des différences notables : c’est le slave qui a le mieux résisté, tandis que l’anglais a réduit la flexion à presque rien. Par contre-coup on a vu s’établir, assez généralement aussi, un ordre plus ou moins fixe pour la construction des phrases, et les procédés analytiques d’expression ont tendu à remplacer les procédés synthétiques valeurs casuelles rendues par des prépositions (voir p. 247), formes verbales composées au moyen d’auxiliaires, etc.).

On a vu qu’un trait du prototype peut ne pas se retrouver dans telle ou telle des langues dérivées : l’inverse est également vrai. Il n’est pas rare même de constater que les traits communs à tous les représentants d’une famille sont étrangers à l’idiome primitif ; c’est le cas de l’harmonié vocalique (c’est-à-dire d’une certaine assimilation du timbre de toutes les voyelles des suffixes d’un mot à la dernière voyelle de l’élément radical). Ce phénomène se rencontre en ouralo-altaïque, vaste groupe de langues parlées en Europe et en Asie depuis la Finlande jusqu’à la Mandchourie ; mais ce caractère remarquable est dû, selon toute probabilité, à des développements ultérieurs ; ce serait donc un trait commun sans être un trait originel, à tel point qu’il ne peut être invoqué pour prouver l’origine commune (très contestée) de ces langues, pas plus que leur caractère agglutinatif. On a reconnu également que le chinois n’a pas toujours été monosyllabique.

Quand on compare les langues sémitiques avec le proto-sémite reconstitué, on est frappé à première vue de la persistance de certains caractères ; plus que toutes les autres familles, celle-ci donne l’illusion d’un type immuable, permanent, inhérent à la famille. On le reconnaît aux traits suivants, dont plusieurs s’opposent d’une façon saisissante à ceux de l’indo-européen : absence presque totale de composés, usage restreint de la dérivation ; flexion peu développée (plus, cependant, en protosémite que dans les langues filles), d’où un ordre de mots lié à des règles strictes. Le trait le plus remarquable concerne la constitution des racines (voir p. 256) ; elles renferment régulièrement trois consonnes (par exemple q-ṭ-l « tuer »), qui persistent dans toutes les formes à l’intérieur d’un même idiome (cf. hébreu qāṭal, qāṭlā, qṭōl, qiṭlī, etc.), et d’un idiome à l’autre (cf. arabe qatala, qutila, etc.). Autrement dit, les consonnes expriment le « sens concret » des mots, leur valeur lexicologique, tandis que les voyelles, avec le concours, il est vrai, de certains préfixes et suffixes, marquent exclusivement les valeurs grammaticales par le jeu de leurs alternances (par exemple hébreu qāṭal « il a tué », qṭōl « tuer », avec suffixe qṭāl-ū « ils ont tué », avec préfixe, ji-qṭōl « il tuera », avec l’un et l’autre ji-qṭl-ū « ils tueront » etc.).

En face de ces faits et malgré les affirmations auxquelles ils ont donné lieu, il faut maintenir notre principe : il n’y a pas de caractères immuables ; la permanence est un effet du hasard ; si un caractère se maintient dans le temps, il peut tout aussi bien disparaître avec le temps. Pour nous en tenir au sémitique, on constate que la « loi » des trois consonnes n’est pas si caractéristique de cette famille, puisque d’autres présentent des phénomènes tout à fait analogues. En indo-européen aussi, le consonantisme des racines est soumis à des lois précises ; par exemple, elles n’ont jamais deux sons de la série i, u, r, l, m, n après leur e ; une racine telle que *serl est impossible, etc. Il en est de même, à un plus haut degré, du jeu des voyelles en sémitique ; l’indo-européen en présente un tout aussi précis, bien que moins riche ; des oppositions telles que hébreu daƀar « parole », dbār-īm « paroles », dibrē-hem « leurs paroles » rappellent celles de l’allemand Gast : Gäste, fliessen : floss, etc. Dans les deux cas la genèse du procédé grammatical est la même. Il s’agit de modifications purement phonétiques, dues à une évolution aveugle ; mais les alternances qui en sont résultées ont été saisies par l’esprit, qui leur a attaché des valeurs grammaticales et a propagé par l’analogie des modèles fournis par le hasard de l’évolution phonétique. Quant à l’immutabilité des trois consonnes en sémitique, elle n’est qu’approximative, et n’a rien d’absolu. On pourrait en être certain a priori ; mais les faits confirment cette vue : en hébreu, par exemple, si la racine de ’anāš-īm « hommes » présente les trois consonnes attendues, son singulier ’īš n’en offre que deux ; c’est la réduction phonétique d’une forme plus ancienne qui en contenait trois. D’ailleurs, même en admettant cette quasi-immutabilité, doit-on y voir un caractère inhérent aux racines ? Non ; il se trouve simplement que les langues sémitiques ont moins subi d’altérations phonétiques que beaucoup d’autres et que les consonnes ont été mieux conservées dans ce groupe qu’ailleurs. Il s’agit donc d’un phénomène évolutif, phonétique, et non grammatical ni permanent. Proclamer l’immutabilité des racines, c’est dire qu’elles n’ont pas subi de changements phonétiques, rien de plus ; et l’on ne peut pas jurer que ces changements ne se produiront jamais. D’une manière générale, tout ce que le temps a fait, le temps peut le défaire ou le transformer.

Tout en reconnaissant que Schleicher faisait violence à la réalité en voyant dans la langue une chose organique qui porte en elle-même sa loi d’évolution, nous continuons, sans nous en douter, à vouloir en faire une chose organique dans un autre sens, en supposant que le « génie » d’une race ou d’un groupe ethnique tend à ramener sans cesse la langue dans certaines voies déterminées.

Des incursions que nous venons de faire dans les domaines limitrophes de notre science, il se dégage un enseignement tout négatif, mais d’autant plus intéressant qu’il concorde avec l’idée fondamentale de ce cours : la linguistique a pour unique et véritable objet la langue envisagée en elle-même et pour elle-même.

↑ Cf. encore d’Arbois de Jubainville : Les premiers habitants de l’Europe (1877), O. Schrader : Sprachwergleichung und Urgeschichte, Id. : Reallexikon der indogermanischen Allertumskunde (ouvrages un peu antérieurs à l’ouvrage de Hirt), S. Feist : Europa im Lichte der Vorgerschichte (1910).
↑ Le signe ’ désigne l’aleph, soit l’occlusive glottale qui correspond à l’esprit doux du grec.
↑ Bien que ce chapitre ne traite pas de linguistique rétrospective, nous le plaçons ici parce qu’il peut servir de conclusion à l’ouvrage tout entier (Ed.).

[1] Cf. encore d’Arbois de Jubainville : Les premiers habitants de l’Europe (1877), O. Schrader : Sprachwergleichung und Urgeschichte, Id. : Reallexikon der indogermanischen Allertumskunde (ouvrages un peu antérieurs à l’ouvrage de Hirt), S. Feist : Europa im Lichte der Vorgerschichte (1910).

[2] Le signe ’ désigne l’aleph, soit l’occlusive glottale qui correspond à l’esprit doux du grec.

[3] Bien que ce chapitre ne traite pas de linguistique rétrospective, nous le plaçons ici parce qu’il peut servir de conclusion à l’ouvrage tout entier (Ed.).

[1]

[2]

[3]

Cinquième partieQuestions de linguistique rétrospectiveConclusion

Chapitre premierLes deux perspectives de la linguistique diachronique

Chapitre IILa langue la plus ancienne et le prototype

Chapitre IIILes reconstructions

§ 1.Leur nature et leur but.

§ 2.Degré de certitude des reconstitutions.

Chapitre IVLe témoignage de la langue en anthropologie et en préhistoire

§ 1.Langue et race.

§ 2.Ethnisme.

§ 3.Paléontologie linguistique.

§ 4.Type linguistique et mentalité du groupe social.

Chapitre VFamilles de langues et types linguistiques[3]