[76]
La dernière liste de langues publiée, celle qu'a donnée le regretté F. N. Finck, Die Sprachstämme des Erdkreises, en renferme plus de deux mille. Ce chiffre n’a, par lui-même, aucune importance : la liste n'a pas été faite suivant un principe un, et il ne serait pas possible d'en dresser une avec rigueur. En effet on peut convenir de compter autant de langues distinctes qu'il existe de parlers inintelligibles pour les sujets employant tout autre parler. Mais cette limité d'intelligibilité est fuyante : le provençal et le français sont assurément deux langues distinctes; car pour qui ne sait que l'une de ces deux langues, l'autre est inintelligible à l'audition; mais le provençal et le catalan sont-ils deux langues distinctes ? Au premier abord, les sujets qui parlent l'une de ces deux langues ne saisissent pas l'autre; mais il faut peu d'efforts à un Provençal pour comprendre un Catalan et inversement. Il est donc impossible de dire combien il existe actuellement de langues. Une chose du moins est sûre : les langues distinctes se comptent par centaines, et il se parle actuellement beaucoup plus de mille idiomes assez différents les uns des autres pour rendre nécessaire l'usage d'interprètes.
Pour mettre un ordre dans cette variété, on a tenté de classer les langues d'après les traits généraux de leur structure grammaticale en langues isolantes, agglutinantes, incorporantes et flexionnelles. Mais, on n'a pas réussi à poursuivre ce classement jusqu'au bout, et dans la mesure où il a été fait, il s'est trouvé dénué de toute utilité soit pratique, soit scientifique; c'est une
[77]
amusette dont aucun linguiste n'a pu tirer parti. Dans son petit livre sur les principaux types de langues, F. N. Finck n'a pu que décrire huit langues particulières arbitrairement choisies.
Fr. Müller, dans son grand exposé des principaux types de langues, et F. N. Finck, dans le petit ouvrage cité ci-dessus, ont été réduits à ranger les Iangues d'après les races d'hommes qui les parlent. Mais comme il n'y a aucun lien nécessaire entre la langue et la race et que personne ne soutient sérieuselllent qu'un certain type linguistique soit lié à un certain type somatique, ce procédé n'a été adopté que comme un pis-aller, et un pis-aller fâcheux. Car il éveille une idée fausse.
Toutefois, si l'on ne connaît aucun principe qui permette actuellement de classer toutes les langues, on a déterminé l'existence de plusieurs groupes linguistiques nets; personne ne doute qu'il y ait un groupe roman, composé de l'italien, de l'espagnol, du français, du roumain, etc. ; un groupe germanique, composé de l'allemand, de l'anglais, du danois, du suédois, etc.; un groupe slave, composé du tchèque, du polonais, du russe, du serbe, du bulgare, etc. ; et ainsi de beaucoup d'autres. Les ressemblances entre les langues qui constituent chacun de ces groupes sont évidentes ; la valeur de ce classement se traduit pratiquement par le fait que si l'on possède l'une des langues du groupe, on acquiert plus facilement les autres. Il y a donc un classement linguistique qui s'applique d'une manière satisfaisante en certains cas. Dès lors il vaut la peine d'examiner si, en appliquant le procédé, on n'arriverait pas à classer toutes les langues.
Le principe de ce classement est simple. Toutes les langues actuellement parlées du groupe roman sont des transformations diverses d'une seule et même langue qui ne se parle plus, mais dont on a des monuments écrits, le latin. Les langues du groupe germanique sont des transformations d'une même langue commune, dont on n'a pas de monuments; mais dont on doit supposer l'existence ; les langues slaves sont les formes diverses prises par une seule et même langue slave commune non attestée. Plus on remonte dans le passé de chacune des langues germaniques, plus se manifeste la ressemblance; et de même pour
[78]
le groupe slave; si les documents conservés permettaient de suivre l'histoire plus loin en arrière, on finirait — et assez vite — par trouver l'identité complète, dans la mesure très approximative où une langue est jamais une. Les groupes de langues utilement constatables sont donc définis par l'unité d'origine. Dire que plusieurs langues appartiennent à un même groupe, c'est dire qu'elles sont des différenciations d'une langue plus ancienne: des langues parentes sont en réalité une seule et même langue modifiée de manières diverses au cours au temps.
Il y a donc une classification linguistique qui, en certains cas au moins, est satisfaisante, la classification «généalogique»; elle a abouti pout beaucoup de langues à des résultats précis que Fr. Müller et F. N. Finck ont insérés au milieu de leur classification ethnique générale; elle a permis, depuis une centaine d'années, de faire l’histoire des langues indo-européennes, des langues sémitiques, des langues finno-ougriennes, des langues bantoues, des langues indonésiennes, et sa fécondité se montre chaque jour plus grande; il était permis de croire qu'elle ne donnerait plus lieu à des discussions et qu’on s'efforcerait seulement d'en poursuivre l'application. Mais elle a été dans les dernières années l'objet de discussions de principe. Il y a en effet des obscurités dont les unes proviennent de la manière dont les langues se transforment, et les autres tiennent à ce qu'il est malaisé de mettre en évidence des communautés d'origine. D'autre part, la difficulté de fait qu'on éprouve à faire entrer toutes les langues dans la classification généalogique a conduit certains linguistes éminents à ôter au principe de cette classification sa précision et sa rigueur ou à l’appliquer d'une manière inexacte. Il ne sera donc pas inutile de remonter à ce principe même et de montrer en quelle mesure une classification généalogique des langues est actuellement possible, jusqu'où elle peut être utile, et ce que l'on en peut espérer.
I/
La formule suivant laquelle certaines langues sont les trans-
[79]
formations d'une langue plus ancienne recouvre des réalités historiques diverses et complexes. En effet les langues ne sont pas des objets ayant une existence matérielle autonome et se développant par eux-mêmes. Une langue est une institution propre à une collectivité sociale, et les modifications qu'elle subit sont liées à l'histoire de cette collectivité. Elle ne se transforme pas comme un manuscrit ou comme un outil. Elle résulte d'une activité mentale des sujets parlants. Elle n'est pas la même chez deux sujets parlant une même langue : il n'y a pas deux Français qui parlent exactement ie même français. Sans doute il existe pour chaque langue une norme à laquelle les sujets parlants tendent à se conformer; mais cette norme est plus ou moins définie suivant les cas, et le sentiment qu’on en a est plus ou moins délicat. Des variations, même étendues, n'empêchent pas les gens de se comprendre entre eux. Par suite, il existe des communautés linguistiques où l'unité est très imparfaite; et il n'y en a aucune où tous les sujets parlent d'une manière sensiblement identique. La formule : une langue est une forme modifiée d'une autre, n'a donc pas un sens llnguistique précis, puisque ni l'une ni l'autre langues ne se laissent exactement saisir à aucun moment.
Du reste les langues ne se maintiennent qu'en se transmettant d'un individu à un autre. Or, les enfants qui apprennent à parler ne reçoivent pas la langue toute faite. Ils ne peuvent reproduire que ce qu'ils entendent, et il est inévitable que des nuances délicates échappent à leur attention. En constituant leur système linguistique avec ce qu'ils ont entendu et remarqué, ils ne reproduisent pas exactement le système linguistique des générations antérieures. Même quand ils emploient les mêmes formes, ils ne les sentent pas toujours de même. Par sa discontinuité naturelle, la transmission du langage donne lieu à des changements. Les enfants sont d'autant plus libres vis-à-vis des générations antérieures que la norme est moins précisément établie et que l'unité est moins réalisée dans la communauté où ils apprennent à parler.
La langue ne se transmet pas seulement de génération en gé-
[80]
nération. Sans cesse il se produit des situations qui engagent ou qui obligent certains sujets à employer, de préférence à leur parler maternel, une langue susceptible de servir à des communications avec un plus grand nombre d'hommes; sans cesse, il y a par suite des groupes d'hommes qui changent de langue. Mais on ne sait jamais parfaitement une langue étrangère; on n'en saisit pas toutes les finesses; on n'en reproduit pas exactement tous les détails ; on n'en applique pas correctement tout le système. Chaque sujet qui emploie une langue étrangère apporte donc un trouble dans la communauté linguistique. Partout où il y a des populations d'origines diverses, la situation linguistique devient incertaine, et Ia liberté des enfants qui apprennent à parler s'accroît. Quand, ainsi qu'il arrive souvent, une population entière change de langue, il est inévitable que la langue nouvellement apprise, d'une part, ne soit pas en tous points conforme au modèle imité, et, d'autre part, soit pendant un certain temps moins stable que n'est une langue fixée par une longue tradition.
Quels que soient les procès, en partie mal éclaircis, par lesquels se réalisent les changements, une chose est sûre: entre l'aspect d'une langue à un certain moment et l'aspect de cette même langue à une époque postérieure, il y a souvent une différence profonde; en quelques siècles, une langue peut devenir méconnaissable. Le français du XIe siècle est du latin, à savoir le latin vulgaire qu'ont adopté vers le Ier siècle après J.-C. les populations de la Gaule du fait de la conquête romaine; mais un Romain du Ier siècle n'aurait pas compris ce latin nouveau pas plus qu'un Français du XIe siècle n'était capable d'entendre le latin ancien. Depuis, le français a continué de changer rapidement en s'éloignant de plus en plus du latin. Mais, si fort que la divergence grandisse, le français ne cessera pas pour cela d'être du latin transformé, aussi longtemps qu'il se parlera.
En effet, la définition de l'identité linguistique ne peut être que sociale: quelles que soient les différences de fait entre les sujets parlants, il y a langue une là où des individus, se comprenant entre eux, ont, d'une façon consciente ou inconsciente, le sentiment et la volonté d'appartenir à une même communauté
[81]
linguistique. La langue change au cours du temps; mais, si l'on considère des sujets contemporains les uns des autres, il y a en un sens unité à chacun des moments successifs qu'on peut envisager. Entre la conquête de la Gaule par les Romains et l'époque actuelle, il n'y a eu aucun moment où les sujets parlants aient eu la volonté de parler une langue autre que le latin. Les habitants de la Gaule ont voulu acquérir le latin, et ils y sont parvenus; le latin vulgaire dont le français est une transformation diffère très peu de celui qui a abouti aux autres langues romanes. Depuis ce temps, les habitants de la France actuelle n'ont jamais eu l'intention de parler une langue nouvelle; ils se sont toujours efforcés de parler leur langue traditionnelle, et ils ont toujours eu le sentiment de parler une même langue. Une différence tranchée n'apparaît que si l'on envisage deux moments éloignés du développement. Par le fait de la diversité des conditions historiques, une même langue peut subir des changements divers dans les différentes régions où elle est employée; dès lors, malgré la persistance de la continuité avec le passé en chaque région, cette langue se brise en un certain nombre de langues qui progressivement deviennent distinctes. Ainsi le latin est devenu suivant les lieux l'italien, le provençal, le français, l'espagnol, le roumain, etc. — On voit par là que ce qui définit une parenté linguistique, c'est seulement un fait historique : une langue sera dite issue d'une autre si, à tous les moments compris entre celui où se parlait la première et celui où se parle la seconde, les sujets parlants ont eu le sentiment et la volonté de parIer une même langue, soit que cette langue se soit transmise normalement de génération en génération, soit que certains groupes d'hommes l'aient adoptée à la place de leur ancien parler. Sont parentes entre elles toutes les langues issues ainsi d'une même langue. Ainsi la parenté de langues résulte uniquement de la continuité du sentiment de l'unité linguistique.
Le sentiment et la volonté qu'ont les sujets parlants d'employer une certaine langue sont chose inconsciente là où il n’existe qu'une langue: dans un milieu linguistique homogène, les sujets parlent comme on parle autour d'eux. Mais, dans les milieux où
[82]
il existe plusieurs manières de parler, on sait toujours qu'on se sert de tel ou tel système: un Breton qui pratique le français et le breton sait en chaque cas s'il parle français ou breton, et il ne mélange pas l'un des systèmes avec l'autre; car les systèmes grammaticaux de deux langues sont, on le verra, impénétrables l'un à l'autre.
On peut être tenté de dire que la langue issue d'une autre plus ancienne, si elle n'est ni identique ni même semblable à celle-ci, est constituée du moins avec les mêmes éléments linguistiques. Mais il n’y a rien à tirer de là.
Tout d'abord ce fait n'a par lui-même guère d'intérêt. Sans doute le -ai du français je ferai et le -ais du français je ferais sont des formes modifiées du latin habeo et habebam. Mais ces mots latins sont si profondément altérés qu'on les reconnaît à peine; même si je ferai était clair, le simple examen du français ne donnerait pas le moyen d'analyser je ferais. Et, s'il est vrai que -ai et -ais sont des éléments latins, ils ont pris un emploi qui n'a pas son équivalent en latin et que rien en latin ne laissait prévoir: entre les formes grammaticales françaises je ferai et je ferais et les mots latins habeo, habebam, il n'y a de commun qu'un fait matériel : -ai et -ais sont des déformations de habeo et de habebam. En tant que formes grammaticales, ce sont de véritables créations. Dans des conditions favorables pour le linguiste, comme celles offertes par les langues romanes, de pareilles créations se laissent expliquer. Mais, dans la plupart des cas, elles demeurent mystérieuses. La grammaire comparée explique bien les survivances d'un état de choses ancien; mais elle échoue souvent quand il s'agit d'expliquer les innovations qui sont de véritables créations. Donc, si l'on considère deux moments du développement d'une même langue séparés par un large intervalle de temps ou par une période de transformations multiples et rapides, on n'arrivera peut-être à presque plus rien expliquer dans le second moment par la considération du premier moment. Les éléments du premier moment considéré seront méconnaissables dans le second.
En second lieu, les langues sont sujettes à emprunter des élé-
[83]
ments à des langues étrangères. Il y a en français moderne des mots nouvellement empruntés à l'anglais, à l'allemand, à l'italien, à l'espagnol, etc., et dont les sujets parlants savent bien qu'ils n'appartiennent pas au vieux fonds français. En ce sens toute langue est mélangée d'éléments étrangers. La part de ces éléments étrangers peut être grande; le persan actuel a un vocabulaire dont, surtout dans la langue littéraire, la plus grande partie se compose de mots arabes; le turc osmanli est plein de mots arabes et de mots persans; l'anglais a pris, depuis la conquête normande, un nombre considérable de mots au français et au latin; le vocabulaire d'une langue peut ainsi se renouveler presque totalement par des emprunts à des langues étrangères. Certains linguistes parlent alors de langues mixtes. L'expression est impropre. Car elle éveille l'idée qu'une pareille langue résulterait du mélange de deux langues placées dans des conditions égales et qu'on ne pourrait pas dire si une langue est la continuation d'une langue A ou d'une langue B, si le persan par exemple est la continuation de l'ancien perse ou de l'arabe. Dans les cas qui ont pu être observés d'une façon précise, on ne constate rien de pareil, et ce n'est pas un hasard historique; cela tient aux conditions mêmes d'existence du langage. Chaque langue constitue un système, et les sujets bilingues qui ont le choix entre deux langues ne mêlent pas ces deux langues: quel que soit le nombre de mots arabes qu'il introduit, Ie Persan sait s'il adopte le système persan ou le système arabe, et il n'y a jamais de doute sur le système adopté. Les Anglais, qui ont admis des mots français innombrables, n'ont pas mélangé pour cela le système français au système saxon. Il y a donc, même dans les cas où les emprunts sont le plus nombreux, deux situations distinctes: celle de la langue que le sujet veut parler et dont il emploie ou cherche à employer le système linguistique, et celle à laquelle il emprunte d'autres éléments, dont le nombre peut d'ailleurs être aussi grand qu'on le voudra. Il y a, d'une part, un fonds indigène, et, de l'autre, des emprunts.
Une langue est définie par trois choses: un système phonétique, un système morphologique et un vocabulaire, c'est-à-dire
[84]
par une manière de prononcer, par une grammaire et par certaines manières de désigner les notions. Chacune de ces trois choses comporte un nombre pratiquement illimité de combinaisons possibles, et par suite on n'a aucune chance de trouver deux langues qui, distinctes par ailleurs, aient ou exactement le même système phonétique ou exactement le même système morphologique.
La prononciation et la grammaire forment des systèmes fermés ; toutes les parties de chacun de ces systèmes sont liées les unes aux autres. Le système phonétique et le système morphologique se prêtent donc peu à recevoir « des emprunts ». En fait il est rare qu'on emprunte à une autre langue soit un phonème (un son du langage)) soit une forme grammaticale ; quand pareil fait se produit, il ne modifie pas l'ensemble de chacun des systèmes et demeure un accident. Au contraire, les mots ne constituent pas un système; tout au plus forment-ils de petits groupes; on peut soit changer le nom d'un objet, soit introduire un nom nouveau sans que cela retentisse sur l'ensemble du vocabulaire; chaque mot existe pour ainsi dire isolément. Aussi peut-on emprunter à des langues étrangères autant de mots que l'on veut; il suffit qu'une langue étrangère ait un prestige, qu’elle soit par exemple celle des maîtres comme l'a été l'anglo-normand en Angleterre à partir du XIe siècle, pour que les emprunts se multiplient. Tous les mots ne s'empruntent pas avec une égale facilité: les mots usuels sont plus malaisément remplacés par des mots étrangers que les mots d'emploi rare; on emprunte volontiers les noms d'objets nouveaux ou d'objets à Ia mode. La grammaire rend parfois les emprunts malaisés: une langue qui, comme le français, a des substantifs sans flexion mais une conjugaison compliquée, emprunte volontiers des substantifs, mais relativement peu de verbes. En somme, le vocabulaire est le domaine de «l'emprunt». Il n’y a pas de mot d’une langue dont on puisse dire a priori qu'il n'est pas emprunté à une langue étrangère. Il n'y a pas de langue ayant une histoire connue dont le vocabulaire ne renferme des emprunts. C'est donc avant tout par la persistance de la prononciation et de la gram-
[85]
maire que se traduit linguistiquement la volonté continue de parler une certaine langue qui définit la «parenté de langues».
Ces systèmes se transforment souvent d'une manière complète. Notamment quand une langue est adoptée par une population qui perd son idiome indigène, le changement peut se précipiter; la prononciation peut alors changer d’un coup; la grammaire peut être simplifiée à l'extrême, comme il est arrivé dans les parlers créoles. Ici encore, certains linguistes seront tentés de parler de langues mixtes; mais le matériel de la langue appartient à un idiome défini; le créole de la Réunion ou de la Martinique est du français imparfait, mais c'est du français; car c'est à l'imitation seule du français de leurs maîtres que les nègres l'ont constitué. La plus grande partie de la conjugaison a été sacrifiée; mais ce qui en subsiste, l'infinitif, est français, et l'on n'y trouve pas le moindre élément africain. Il y a eu perte brusque d'une très grande partie d'un système grammatical au moment où une population de langue très différente et placée dans une situation sociale inférieure a appris une langue nouvelle. Les changements portent sur l'ensemble de chaque système, et l'on peut relier le système, ancien au nouveau, par un ensemble de formules de transformation. D'ailleurs, au début du moins; il subsiste toujours dans le système nouveau une portion notable du système ancien, et le peu que le créole a de grammaire est de la grammaire française. Tout ce qu'exige la définition, c'est qu'entre deux moments du développement de la langue immédiatement voisins l’un de l'autre, il y ait continuité dans l'emploi du système grammatical.
On ne peut pas dire que tout emprunt phonétique ou grammatical soit impossible. Dans certaines conditions favorables où des populations se mélangent d'une manière intime et où des sujets parlants, perdant le sentiment net d'appartenir à une certaine nation, ne s'attachent pas à parler leur langue avec pureté, il peut se produire des emprunts de ce genre. Ainsi, sur le domaine gallo-roman, à l'époque des invasions franques et de la domination mérovingienne, la langue de civilisation qu'était le latin s'est maintenue et a fini par s'imposer au peuple conqué-
[86]
rant, de langue germanique. Toutefois durant longtemps les conquérants ont gardé leur langue qui avait le prestige d'être la langue des maîtres. Le gallo-roman a dont emprunté beaucoup de mots à a? langue des Francs. Mais cette langue comprenait des phonèmes dont le gallo-roman n'avait pas l'équivalent ; le latin vulgaire n'avait pas d'h, alors que h était fréquent en germanique, et le latin vulgaire avait un v labio-dental (le v français), alors que les Francs employaient la biIabiale w (w anglais). Les Francs qui parlaient latin ont gardé h et w dans les mots germaniques qu'ils mêlaient â leur latin, et les populations gaIlo-romanes ont tenu à prononcer correctement ces mêmes mots germaniques; hapia a donc gardé son h dans la forme empruntée, et le mot est représenté en français par hache, avec une h «aspirée» ; werra a gardé son w qui a fini par se prononcer gu, et ce mot est représenté en français par guerre ; deux phonèmes nouveaux se sont introduits ainsi en gallo-roman. Ils ont même été adaptés à des mots latins; altu, « haut» du latin vulgaire a reçu h sous l'influence du synonyme germanique hauh; vespa « guêpe» a reçu w sous l'influence du synonyme germanique wefsa ; et ainsi de nombreux autres cas: ceci montre que, pendant un temps, il a été élégant de prononcer ces mots latins avec un «accent» germanique. Des mots latins désignant des choses militaires se sont ainsi conservés avec une prononciation germanisée : vagina «foureau» est devenu wagina, qui est représenté en: français par gaîne. Ces deux additions au système phonétique latin sont quelque chose d'exceptionnel et dont les langues romanes autres que le français n'offrent pas l'équivalent; chose curieuse, elles n'ont guère été durables: le w a rapidement passé à gu, puis à g tel qu'on l'avait dans des mots indigènes comme goût; quant à l'h, elle s'est maintenue davantage ; mais elle a fini par disparaître aussi, et l'on sait que le français actuel n'a pas d'h; la présence, ancienne de h se traduit seulement par des hiatus: la haute montagne. Il y a aussi des emprunts grammaticaux; mais, comme les emprunts de phonèmes qu'on vient de voir, ils sont liés à des emprunts de mots, et ils concernent ce qu'il y a pour ainsi dire de moins grammatical dans la grammaire.
[87]
Il n'y a pas d'exemple qu'une flexion comme celle de j’aimais, nous aimions ait passé d'une langue à une autre; on n'emprunte une chose de ce genre que si l'on emprunte tout le système d'un coup, c'est-à-dire si l'on change de langue. Mais le turc a pu emprunter au persan le relatif ki. Prenant au latin des noms en -ariu indiquant un métier, le germanique a pu développer un suffixe -arja-, et, de même que le latin avait librarius en face de liber, on a fait en gotique bokareis «scribe» en face de boka «lettre», bokos «livres»; et ainsi le suffixe des noms d'agents en germanique (celui de l'allemand schreiber) se trouve être d'origine latine; mais ce n'est encore que de l’emprunt de vocabulaire. On a même signalé, dans un endroit où le portugais et l'anglais étaient en contact, l'emploi ee tours tels que gobernador's casa d'après l'anglais governor' s house; il y a eu ici emprunt de l'ensemble d'une expression; d'ailleurs l'élément 's est si autonome dans ce tour anglais qu'il peut presque passer pout un mot, et le cas est assez comparable à celui de l'emprunt du relatif ki par Le turc. Il arrive -, en une mesure au reste assez faibIe, et dans des situations très particulières -, qu'on emprunte à une langue étrangère des petits mots à valeur grammaticale; on n'emprunte guère de vraies formes grammaticales. Ainsi l'on est toujours ramené à la même conclusion: ce qui s'emprunte, ce sont essentiellement des éléments de vocabulaire.
L'exposé précédent repose sur l'idée que le sujet parIant a toujours l'intention de parler une langue définie; et le principe est valable tant qu'il s'agit de langues nettement distinctes, qui excluent une c0l1ll11unication entre sujets de langues différentes, comme le français, le provençal, l'italien, l'allemand, le hongrois, etc.; peu importe que ces langues soient ou non de même famille. Les choses se présentent autrement si l'on envisage des parlers divers appartenant à un même groupe dialectal ou des patois employés par des gens qui ont par ailleurs une grande langue commune de civilisation de type voisin de leur parler local. Alors les sujets parlants peuvent imiter un parler qui passe pour plus élégant ; le français d'un paysan du centre de·la France est du patois plus ou, moins francisé, et toujours incom-
[88]
plètement; le patois de ce même paysan est souvent en grande partie du français patoisé. Il peut en pareil cas n'y avoir aucun sentiment net qu'on emploie tel ou tel parler; alors il y a vraiment mélange, non de langues, mais de parlers divers d'une même langue, et l'on ne saurait toujours dire, au terme d'un développement linguistique de ce genre, quel parler a triomphé. Mais ceci n'empêche pas de savoir quelle langue ont parlé les sujets considérés; le français commun d'aujourd'hui repose avant tout sur le parisien; et il s'y mêle de plus en plus tant d'éléments provinciaux qu’il n'est pas licite de dire que ce soit du parisien; en revanche, c'est du français, parce que les sujets n'ont jamais eu l'intention de parler autre chose que français; on ne saurait dire au juste si le grec moderne est de l'attique ou de l'ionien ; car les sujets n'ont pas toujours voulu parler attique ou ionien ; mais il est évident que c'est du grec ionien-attique: la volonté de' parler ce grec a été constante chez les sujets qui ont transmis la langue, et ceci suffit.
La définition de la parenté de langues ne s'applique donc qu’à de grands groupes, nettement distincts les uns des autres, non à des parlers distingués par de simples nuances. Et ceci encore résulte du caractère social de la définition.
II/
Ces principes une fois posés, on voit comment peut se prouver une parenté de langues.
Partout où le système phonétique et le système grammatical présentent des concordances précises, où des correspondances régulières permettent de reconnaître l'unité d'origine des mots et du système phonétique et où le système des formes grammaticales s'explique en partant d'un original commun, la parenté est évidente. Les langues romanes sont visiblement parentes, parce que le nombre des concordances de détail qu'elles offrent est grand et que leur grammaire et leur système phonétique s'expliquent dans l'ensemble par une origine commune. L'identité des grammaires est évidente. Ainsi l'on a à l'infinitif: ita-
[89]
lien cantare, espagnol cantar, français chanter; à l'indicatif présent, 3 e personne, au singulier it. et esp. canta, fr. chante, au pluriel; it. cantano, esp. cantan, fr. chantent; au prétérit simple, 2e personne, singulier it. cantasti, esp. cantaste, fr. chantas, pluriel it. cantaste, esp. cantasteis, fr. chantâtes etc. Ainsi que l'a bien montré, ici-même[1], M. Grammont, la constatation de la parenté facilite beaucoup l’apprentissage des langues en pareil cas: la seule correspondance, espagnol h = italien et français f, fait prévoir la forme de beaucoup de mots, comme esp. haba = ital. fava, fr. fève; esp. hacer = ital. facere = fr. faire; etc. Du même coup l'on voit que l'h espagnole, qui apparaît comme une divergence dans le système ·phonétique des langues· romanes, est la transformation d'une f, et comment, par suite, l'espagnol se ramène historiquement au type général de ces langues. Il se trouve de plus que les vocabulaires concordent dans une large mesure ; le fait que l'espagnol a un grand nombre de mots arabes qui ne se retrouvent ni en italien ni en français ou que le français a des mots gaulois et germaniques qui ne se retrouvent ni en italien ni en espagnol ne change rien à la parenté; car il s'agit d'emprunts. La preuve d'une parenté de langues est d’autant plus solide qu'elle se rapproche plus du cas qui vient d'être sommairement décrit.
Il va de soi que, pour établir une parenté de langues, il faut faire abstraction de tout ce qui s'explique par des conditions générales, communes à l’ensemble des langues. Ainsi les pronoms doivent être des mots courts, nettement constitués avec des éléments phonétiques aisés à prononcer, et en général sans groupes de consonnes. Il en résulte que les pronoms se ressemblent plus ou moins partout, sans que ceci implique une communauté d'origine. Et, d'autre part, les pronoms se ressemblent souvent assez peu dans des langues d’ailleurs très semblables; qu'on compare par exemple les pronoms de l'arménien avec ceux du gotique ou de l'irlandais. Même des formes qui, en fait, se ramènent à un même prototype, comme nous du français et us de l'anglais,
[90]
peuvent ne plus offrir un seul élément commun (l' s du français nous n'étant que graphique). On ne peut donc tirer parti des pronoms dans la détermination des parentés de langues qu'avec précaution.
Dans cet exposé on n'a tenu aucun compte des ressemblances générales de structure que peuvent présenter les langues considérées : le français et l’anglais s'accordent à caractériser plusieurs catégories grammaticales par un ordre de mots défini, à employer un article devant les substantifs, à se servir de petits mots accessoires pour indiquer la possession, l'attribution ; tout cela, n'implique pas une origine commune, parce que, d'une part les ordres de mots en question offrent trop peu de variations possibles pour que les concordances soient significatives, et que, d'autre part, les petits mots accessoires de même valeur grammaticale qui sont employés dans ces deux langues ne sont pas réductibles à des origines communes: ainsi angl. the et fr. le, angl. of et fr. de, angl. to et fr. à, angl. we et fr. nous, angl. you et fr. vous, angl. he et fr. il n'ont rien de commun. Si l'on n'avait pas les anciens dialectes germaniques d’un côté et le latin de l’autre, la parenté du français et de l'anglais ne serait pas démontrable. Le chinois et telle langue du Soudan, celle du Dahomey ou ewe, par exemple, peuvent se servir également de mots· courts, en général monosyllabiques, faire varier la signification des mots en changeant l'intonation, fonder leur grammaire sur l'ordre des mots et sur l'emploi de mots accessoires; il n'en résulte pas que le chinois et l'ewe soient des langues parentes; car le détail concret des formes ne concorde pas ; or, seule la concordance des procédés matériels d'expression est probante. C'est pour cette raison que les linguistes qui exigent des preuves rigoureuses ne considèrent pas comme établie l'existence de la famille ouralo-altaïque à laquelle on a autrefois attribué tant d'importance ; entre le turc d'une part, le finnois et le hongrois de l'autre, il y a des concordances générales de structuré grammaticale; mais ce qui prouve une parenté, c'est la concordance dans le détail matériel des moyens d'expression; or, si l'on trouve des formations définies communes au finnois et au hongrois et si le finnois et le
[91]
hongrois se laissent expliquer par une même langue commune (qu’on voie par exemple le petit livre de M. Szinnyei, Finnisch-ugrische Sprachwissenschaft), on n'a constaté rien de pareil entre le finno-ougrien et le turc, et dès lors aucune parenté n'est démontrée. Le fait de procéder uniquement par suffixation, l'emploi de l'harmonie vocalique, etc. ne constituent pas des preuves de parenté.
Quand, dans son article de «Anthropos», VIII (1913), p. 389 et suiv., intitulé The Determination of Linguistic Relationship, un américaniste émiinent, M. Kroeber, a protesté contre l’emploi des concordances générales de structure morphologique pour établir des parentés de langues, il a eu entièrement raison. Seulement il n'est pas licite de conclure de là que les parentés doivent s'établir par la considération du vocabulaire, non par celle de la morphologie; si juste qu'elle soit, la critique: de M. Kroeber ne justifie pas le procédé de certains américanistes qui fondent sur de pures concordances de vocabulaire leurs affirmations relatives à la parenté de telles ou telles langues entre elles. Les concordances grammaticales prouvent, et elles seules prouvent rigoureusement, mais à condition qu'on se serve du détail matériel des formes et qu'on établisse que certaines formes grammaticales particulières employées dans les langues considérées remontent à une origine commune. Les concordances de vocabulaire ne prouvent jamais d'une manière absolue, parce qu’on ne peut jamais affirmer qu'elles ne s'expliquent pas par des emprunts. On sait maintenant que les nombreux mots turcs présentés par le hongrois n’apportent à l'hypothèse d'une parenté du turc avec le hongrois aucun commencement de preuve. A en juger par le vocabulaire, l'anglais serait un mélange de germanique et de roman; tout au plus pourrait-on constater que le fonds principal du vocabulaire courant, pronoms personnels, noms de nombre, noms de parenté; noms des parties du corps, noms des animaux les plus connus, verbes usuels tels que «manger» et «dormir», est germanique, et non roman. Mais il suffit de considérer la grammaire pour lever tout doute: rien dans le détail matériel de la grammaire anglaise ne
[92]
s'explique par le latin, tout s'y explique par la grammaire ancienne du germanique.
Il est vrai que la structure générale de la morphologie anglaise moderne diffère du tout au tout de celle de l'ancienne morphologie germanique; mais ceci est sans importance : la parenté n'implique aucune ressemblance actuelle des langues considérées, ni, surtout du système général des langues considérées; et inversement il y a beaucoup de ressemblances, soit de structure générale, soit de vocabulaire, qui n'impliquent pas parenté.
Dans l'article cité ci-dessus, M. Kroeber insiste sur l'importance qu'il y a à tenir compte du voisinage géographique des langues. Sans doute il arrive le plus souvent que les langues parentes occupent des aires contiguës ou du moins voisines. Mais, une fois mis à part ce fait grossier, il faut reconnaître que la contiguïté apporte à la démonstration linguistique de la parenté une gêne plutôt qu'un secours : les langues voisines sont celles qui ont subi les mêmes influences, qui ont emprunté les unes aux autres ou fait les mêmes emprunts à d'autres langues. La contiguïté des langues oblige donc à faire un départ, souvent très délicat entre les emprunts et le vieux fonds de la langue, qui seul prouve en matière de parenté. En revanche, le grand éloignement géographique n'a pas empêché les linguistes de montrer que la langue de Madagascar représente la même langue ancienne que celles de Bornéo, de Java et des Philippines.
S'il s'agit de langues parentes qui ont cessé d’être très semblables entre elles, une forte ressemblance extérieure entre deux mots est, pour le linguiste, une raison de douter qu'ils représentent un même terme de la langue originelle. Le français feu n’a rien de commun avec l'allemand feuer; en revanche l'allemand feuer remonte à un original que représentent par ailleurs des mots assez différents: grec pûr, arménien hur, A qui sait que le latin, le germanique, le slave et l'arménien représentent une même langue commune, relativement ancienne, il est facile de montrer quels rapports il y a entre le français cinq (représentant le latin quinque) et les équivalents five de l'anglais, piat' du russe, hing de l'arménien; mais, au premier abord; ces mots ne se
[93]
ressemblent guère. Ce n'est pas sur la ressemblance extérieure des mots que se fondent les linguistes pour les rapprocher et en faire l'étymologie, mais sur des formules de correspondances régulières. Ainsi à un p du grec ou du slave, à l'initiale des mots, répondent h en arménien, f en germanique, l'absence de toute consonne en celtique. Ces formules une fois établies permettent de reconnaître dans ses grandes lignes l'histoire de la prononciation et d'établir comment les systèmes phonétiques se sont succédé les uns aux autres dans des langues apparentées.
Comme on l'a noté déjà, il n'y a pas lieu pour faire la preuve, d'exiger que toutes les formes grammaticales s'expliquent; il suffit d'établir que des portions notables de la morphologie ancienne subsistent dans la langue considérée. Nulle part il n’est aussi aisé d'établir une parenté de langues qu'entre les langues indo-européennes, parce que la langue commune sur Iaquelle reposent les idiomes de cette famille comportait une morphologie très compliquée, d'une complication qui passe beaucoup la normale, et que de nombreux restes de· ses formes ont subsisté dans chaque langue; ce sont par exemple les verbes irréguliers du grec, les verbes forts du germanique, etc. Partout où l'on rencontre des débris importants du système verbal indo-européen, système que l'on connaît par les plus anciens textes, ceux de l'indo-iranien ancien et du grec ancien, on est sûr d'être en présence d'une langue indo-européenne. La démonstration de parenté est parfaite si l’on peut expliquer par la transformation des mêmes éléments anciens l'ensemble du système grammatical de deux langues distinctes.
A la longue, cependant, des langues parentes finissent par différer tant que leur communauté d'origine devient impossible à reconnaître. Si par exemple on n'avait que le français, le bulgare et l'arménien modernes pour représenter le groupe indo-européen, il ne serait pas aisé d'établit la parenté de ces trois langues, et l'on ne pourrait songer à en poser la grammaire comparée. II suffit d'opérer avec ces mêmes langues, mais considérées sous des formes de quelques centaines d'années plus anciennes, à savoir le latin, le vieux-slave des premières traductions et·
[94]
l'arménien classique, pout que la parenté devienne évidente et pour qu'on puisse poser les principes essentiels d'une grammaire comparée de ces trois langues. La parenté de deux langues peut donc être et est souvent indémontrable, même alors qu'elle est réelle. On n'est jamais en droit d'affirmer que deux langues ne sont pas parentes au moins de loin; une parenté se découvrirait peut-être si l'on avait des formes plus anciennes de ces mêmes langues.
Bien qu'une démonstration complète de parenté de langues soit difficile à fournir, on a établi plusieurs grandes familles linguistiques: la famille indo-européenne qui occupe une aire immense et qu'on suit historiquement depuis près de trois mille ans; la famille sémitique, moins vaste; mais dont les premiers textes écrits sont plus anciens; la famille finno-ougrienne; la famille bantoue; la famille indonésienne; la famine polynésienne (extraordinairement une); la famille dravidienne; la famille caucasique du Sud; d'autres encore. On voit que le principe ne s'applique pas seulement à l’Europe ou aux langues indo-européennes, ou aux grandes langues de civilisation : il est universellement valable. Il ne manque pas de cas ou le travail n'est pas encore fait, mais déjà l'on entrevoit clairement la possibilité de mettre en évidence certaines autres familles linguistiques définies : il doit y avoir par exemple une famille hamitique dont la grammaire comparée n'est pas encore faite. Il suffit d'un travail méthodique pour aboutir à coup sûr à des résultats certains sur plusieurs domaines.
Mais il y a de graves difficultés.
Tout d'abord une difficulté de fait. Pour beaucoup de langues de peuples non civilisés, on n'a que des vocabulaires, et la grammaire est ou inconnue, ou connue d’une manière toute partielle. Si, en pareil cas, on observe un très grand nombre de communautés de vocabulaire entre certaines langues, et si ces communautés concernent les mots les moins sujets à emprunt, notamment les verbes qui indiquent les actions usuelles comme aller et venir, boire et manger, vivre et mourir, entendre et voir, dire et se taire, etc.) ou des adjectifs comme vieux et neuf, grand
[95]
et petit, long et large, etc. ~ ce serait pur pédantisme que de se refuser à en faire usage. Seulement il ne faut pas se faire illusion sur la rigueur de la preuve ainsi faite, bien que la possession en commun d'un certain fonds de vocabulaire indique le plus souvent une parenté. Là où l'on n'a pas d'autres données, on peut provisoirement, et en faisant les réserves nécessaires, se servir des indications ainsi obtenues. L'observation attentive du vocabulaire conduit du reste presque toujours en pareil cas à relever quelques coïncidences grammaticales qui achèvent la démonstration.
En second lieu, les langues spéciales échappent en partie à la définition qui résulte des considérations présentées ci-dessus. Elles n'y échappent pas à la lettre·; elles la confirment même en un sens: les langues spéciales ne comportent en général ni une prononciation, ni une grammaire propres; l'argot français par exemple est caractérisé uniquement par des mots particuliers. Et ceci montre comment le vocabulaire est indépendant des systèmes phonétique et morphologique qui définissent une langue: l'argot est une langue spéciale à l'intérieur du français. La chose va parfois très loin; ainsi le tsigane arménien est purement de l'arménien pour la prononciation et la grammaire; mais le vocabulaire n'a rien d'arménien; ceci s'explique par le fait que les Tsiganes d’Arménie, sachant l'arménien, ont employé uniquement le système arménien, mais que, désirant parler une langue spéciale, inintelligible au reste de la population, ils ont gardé leur vocabulaire traditionnel. Si l'on· applique à la lettre la définition, le tsigane arménien est purement et simplement de l'arménien; mais il faut convenir qu'on est ici en présence d’un cas tout particulier. Ceci revient à dire que la définition générale des parentés de langues, faite pour des populations de type normal, s'applique mal aux langues spéciales de populations parasites. Toutefois, comme, en ce cas, il n'y a mélange ni au point de vue phonétique ni au point de vue grammatical, le principe est rigoureusement confirmé.
En troisième lieu, il y a des langues qui, étant entourées de langues d'une autre famille et paraissant être des débris isolés
[96]
d'une famille disparue, ne se laissent pas grouper avec les langues voisines et ne rappellent même aucune langue connue. Leur système grammatical n'offre de concordances précises avec aucun autre idiome, ou du moins n'en signale-t-on pas. C'est le cas du basque par exemple. Un linguiste illustre, un de ces hommes' toujours rares dont les connaissances sont larges et qui se soucient plus de ce qui reste à trouver que de ce qui est déjà découvert, M. H. Schuchardt, a été conduit à rechercher si le basque n'offrirait pas avec des langues hamitiques quelques concordances; il y a relevé des mots qui rappellent des mots nubiens, et, d'une manière générale, des mots hamitiques, et a signalé ces concordances dans deux articles récents. Mais ces concordances sont vagues, peu nombreuses. Il n'est pas évident qu'on ne trouverait pas entre le basque et le vocabulaire d'un groupe quelconque de langues des concordances analogues. Dans son Baskisch und Hamitish, pag. 6 (extrait de la «Revue internationale des études basgues», VII (1913), M. Schuchardt dit que les jeunes gens dont le coup d’œil n'est pas assez formé sont trop portés à tenir les comparaisons de mots pour fortuites: On en juge tout autrement, dit-il, quand on s'est beaucoup exercé aux comparaisons de mots et qu'on a acquis en cette matière un certain sentiment statistique. Mais on ne peut pas fonder une doctrine sur un sentiment individuel. Et d'ailleurs même si les ressemblances de vocabulaire signalées ne sont pas fortuites, on n'a aucun moyen de montrer qu'elles ne proviennent pas d'emprunts. Peut-être dira-t-on que, si l'on n'avait de langues indo-européennes que le, français actuel et l'arménien moderne, les seules traces de la parenté de ces deux langues qu’on pourrait découvrir seraient des mots, comme le nom de mère, en arménien actuel mer ou mar, suivant les dialectes; ou le nom de nombre dix, en arménien tas ou das suivant les dialectes ; et ce sont en effet des traces valables pour qui connaît la parenté des deux langues, mais ce ne seraient pas des preuves pour qui ne la connaîtrait pas, et en fait la ressemblance frappante de ces mots, effectivement parents, provient d'une série d'accidents fortuits. Au lieu de converger, ces mots auraient pu tout aussi bien diverger comme
[97]
fr. père et arm. her ou har, fr. vingt et arm. khsan, qui sont également parents; et la communauté d'origine serait impossible à reconnaître directement. Si donc on peut d'abord constater des ressemblances de vocabulaire entre deux ou plusieurs langues pour indiquer de quel côté il faut chercher, ce n'est pas de là que peut venir une démonstration définitive; le vocabulaire ne peut servir qu'à orienter la recherche; la preuve se trouve ailleurs.
Enfin, le procédé de démonstration des parentés de langues indiqué ici s'applique bien à des langues dont le type originel a comporté une grammaire compliquée. S'il s'agit de la famille indo-européenne ou de la famille bantoue, il n'y a pas de difficulté; tant qu'on n'a pas affaire à des langues séparées de la période commune par un trop long intervalle de temps ou par des altérations trop profondes, les choses sont même le plus souvent évidentes du premier coup. D'anciennes langues indo-européennes comme le gotique ou le slave ont une grammaire très différente de l'ancienne grammaire indo-européenne ; mais il subsiste assez de restes de cette grammaire, soit parmi les formes régulières, soit surtout parmi les formes anomales pour que le caractère indo-européen de la langue se voie sans exiger une démonstration. Si transformé, si éloigné de l'ancien type indo-européen que soit le «tokharien» récemment découvert en Asie centrale, on l'a du premier coup reconnu pour indo-européen ; le nombre des particularités grammaticales indo-européennes conservées y est encore grand. Mais, si l'on est en présence de langues qui n'ont presque pas de grammaire, si presque toute la grammaire proprement dite tient en quelques règles de position relative des mots, comme dans certaines langues d’Extrême-Orient ou du Soudan, le procédé ne s'applique pas. Et alors la question des parentés de langues est pratiquement insoluble, aussi longtemps qu'on n'aura pas trouvé de critères qui permettent d'affirmer que des langues de ce type sont issues les unes des autres et que les ressemblances de vocabulaire qu'eIles offrent ne sont pas dues à des emprunts. II ne résulte pas de là que le principe, applicable ailleurs, devienne mauvais ici, mais seulement que certaines
[98]
langues ne comportent pas, en l'état présent des connaissances, une classification généalogique. Il appartient aux linguistes qui s'occupent de ces langues d'aviser à tourner la difficulté. La chose n'est pas impossible, pour peu qu'on sache rester fidèle à l'esprit du principe plutôt qu'à sa lettre.
Si même une solution ne se laissait pas trouver, il n'y aurait pas lieu de critiquer les linguistes à cause de cette impuissance : il est remarquable qu'on puisse en certains cas faire la preuve de la parenté de langues par des faits d'ordre purement linguistique; mais il n'est pas surprenant que cette preuve ne soit pas toujours possible·; il est naturel qu'elle s'applique seulement aux cas où les faits envisagés ne sont pas séparés du début de l'époque proprement historique par un trop long espace de temps et où les transformations n'ont pas été trop profondes. De par sa nature, la classification généalogique des langues admet d’être incomplète. Elle se complétera au fur et à mesure qu'on acquerra des données sur l’histoire des langues.
C'est dire que le problème de l'unité d'origine des langues qui préoccupe certains linguistes ne saurait ·se discuter actuellement. Les problèmes qui peuvent être utilement posés à cet égard sont ceux qui sont relatifs à la constitution exacte de familles qu'on entrevoit, mais qu’on n'a pas étudiées avec précision. Les familles qu'on a constituées jusqu'ici sont celles qui apparaissent aisément ou celles qui renferment des langues de civilisation importantes. Le travail qui reste à faire est plus décourageant; car il s'agit en partie de langues où les relations de parenté sont malaisées à établir en partie de langues sauvages peu connues et que presque personne n'a d'intérêt ·pratique à étudier. Il a été aisé d'établir la parenté de langues dont on avait de bonnes grammaires et dont la philologie était faite ; on est maintenant devant des langues dont il faut faire la: grammaire et dont la plupart, faute de textes anciens, ne comportent aucune philologie. Il y a donc un grand travail d'observation à faire. Si des résultats plus nombreux ne sont pas acquis, cela tient avant tout au petit nombre ou à l'absence de savants qualifiés capables de faire ce travail. Pour compIéter rapidement la classification généalogique des langues, il
[99]
suffirait de fermer quelques équipes de linguistes. Un seul bon travailleur peut suffire à poser une grammaire comparée là où l’on a de bonnes descriptions; c’est ainsi que M. Brandstetter constitue actuellement la grammaire comparée des langues indonésiennes.
Il n'y a pas de raison de croire que certaines langues communes d'où sortent les grandes familles établies ne sont pas, à leur tour des transformations d'une même langue plus ancienne. On peut imaginer, par exemple, que l'indo-européen, le sémitique (qui est apparenté au hamitique), le caucasique du Sud et le finno-ougrien sortiraient d'une même langue plus ancienne; il a déjà été signalé des concordances entre l'indo-européen et le sémitique, entre l'indo-européen et le finno-ougrien, entre le caucasique du Sud et le sémitique. Mais beaucoup de ces concordances ne concernent que le vocabulaire et ne sauraient passer pour probantes; ceIles qui concernent la grammaire sont peu nettes et peu nombreuses. La preuve n'est pas faite; elle ne pourrait du reste être acquise que le jour où la grammaire comparée du sémitique et du hamitique sera constituée, ainsi que celle du Caucasique du Sud dont il ne faut peut-être pas séparer les langues caucasiques du Nord; lesquelles sont très variées ; il faudrait tenir compte des langues d'Asie Mineure; du lycien qu'on ne comprend guère, du hittite qu'on n'a pas encore déchiffré[2], ou de langues plus lointaines comme l'élamite. Il se pose là de grands problèmes, dont la solution n'est pas désespérée. Mais on a souvent eu le tort, dans les derniers temps, de vouloir les résoudre avant d'avoir fait les travaux préparatoires nécessaires. Tant que la grammaire comparée du hamitique et celle du caucasique seront à peine esquissées; tant que par suit, la position exacte du sémitique sera inconnue; il sera prématuré de vouloir relier le sémitique à l'indo-européen.
[100]
Toutefois les meilleurs linguistes feront œuvre vaine s'ils s’attaquent directement à des langues trop différentes; on pourra peut-être rapprocher un jour les grammaires comparées de l'indo-européen, du sémitique, du hamitique, du caucasique, du finno-ougrien; il y a là une hypothèse qu'on pourra essayer de vérifier quand les travaux préparatoires suffisants seront faits, et que, dès maintenant, plus d'un fait rend vraisemblable. Mais il serait vain de vouloir comparer aujourd'hui le latin, l'hébreu et le géorgien. Tout essai de ce genre est une faute évidente contre la méthode.
La classification généalogique des langues est en fait, on le voit, chose différente des classifications biologiques. Une classification telle que la classification linnéenne consiste à rapprocher des êtres qui ont des structures anatomiques analogues et où au moins le commencement du développement de chaque individu depuis la cellule initiale est comparable, donc des êtres qui, dans leur développement individuel, offrent actuellement des caractères communs, alors même que, à l’état adulte, leur aspect extérieur et les fonctions remplies par certains de leurs organes diffèrent le plus.
Il est possible, et l'on admet en général, que les êtres qui sont ainsi rangés dans une même classe sortent d’un même ancêtre ou d'ancêtres exactement semblables ; mais cette hypothèse, qui explique les ressemblances constatées, n'est pas le principe de la classification, bien que les biologistes tendent de plus en plus à tenir compte de la façon dont ont évolué les êtres qu'ils étudient et qu'ils classent, et aussi à ne pas négliger les rapports entre, les diverses classes. Le jour où les biologistes arriveraient à suivre exactement l'évolution qui a abouti à différencier les espèces, leurs classifications deviendraient comparables aux classifications linguistiques; entre les unes et les autres, la différence essentielle serait seulement celle du degré de rapidité de l'évolution, l'évolution linguistique étant beaucoup plus rapide, l'évolution biologique souvent si lente que les espèces semblent stables.
Pour le linguiste, seul le fait historique de la continuité entre une langue ancienne et des langues postérieures entre en considération. En l'état présent des choses, l'anglais et le russe sont
[101]
deux langues de type absolument distinct; et c'est à peine si l'on y peut discerner quelques éléments de vocabulaire semblables; cela n'empêche pas que ce soient deux langues indo-européennes; la preuve résulte de ce que l'anglais moderne continue le vieil anglais, et le russe moderne, le vieux russe; or, le rapprochement du vieil anglais et du vieux russe est démontrable directement, et surtout il est facile de prouver que le groupe germanique dont l'anglais fait partie et le groupe slave dont le russe est l'un des représentants sont tous deux des formes prises par la langue indo-européenne commune. Tant que deux langues de même famille subsistent, leur appartenance à cette famille ne saurait subir un changement, quelles que soient les transformations subies, et même si les altérations intervenues ne laissent subsister aucune trace de la commune origine des deux idiomes.
La détermination de la famille à laquelle appartient une langue est une donnée indispensable à fixer pour faire l'histoire de cette Iangue. Mais, cette donnée une fois acquise, il reste à déterminer le détail des changements intervenus et à reconnaître les influences subies. Ces changements et ces influences sont souvent pour beaucoup plus que la langue initiale dans le résultat final. La notion de parenté des Iangues est chose précise; mais, justement parce qu’elle est définie d'une manière précise, elle n'est que l'une des données avec lesquelles opère l'historien du langage.
Comme la parenté de langues est rigoureusement déterminable et que, au contraire, à part les emprunts de mots, les influences qui déterminent les changements linguistiques ne se laissent ni reconnaître d'une manière exacte, ni surtout établir d'une manière certaine, la parenté tient dans les théories des linguistes, une place qui dépasse — et, sans doute de beaucoup — son importance réelle. Mais, en la définissant bien et en n'oubliant pas que la tradition continue des parlers n'est ni le tout ni toujours le principal de ce qui conditionne le développement des langues, on peut fonder sur la théorie de la parenté la théorie historique des langues.
[1] Scientia, vol.·XII, n° XXIV-4 (1912), p. 72 et suiv.
[2] Le présent article a paru en 1914; les textes hittites sont maintenant lus et déchiffrés, surtout par M. Hrozný; mais l'interprétation est encore très hypothétique, et l’affirmation que le hittite serait indo-européen paraît bien aventurée; elle a été contestée par la plupart de ceux qui ont examiné les documents.