Accueil | Cours | Recherche | Textes | Liens

Centre de recherches en histoire et épistémologie comparée de la linguistique d'Europe centrale et orientale (CRECLECO) / Université de Lausanne // Научно-исследовательский центр по истории и сравнительной эпистемологии языкознания центральной и восточной Европы

-- Les langues du monde par un groupe de linguistes sous la direction de A. Meillet et Marcel Cohen, Paris : Librairie ancienne Edouard Champion, 1924, p. VII-X et 1-18.

 [VII]       
        AVANT-PROPOS
        Les auteurs du présent recueil ont voulu donner une idée de la répartition des langues dans le monde, en tenant compte de l'histoire de ces langues.
        Un ouvrage collectif tel que celui-ci manque nécessairement d'unité.
        Les divers domaines sont inégalement étudiés : depuis le groupe indo-européen, pour lequel il existe une jgrammaire comparée minutieusement établie, jusqu'aux langues américaines pour lesquelles on n'a d'ordinaire pas dépassé, et souvent pas atteint, le stade de la description, il se rencontre toutes sortes de cas.
        D'autre part, les auteurs ont des formations, des habitudes d'esprit différentes.
        II aurait été vain de chercher à obtenir des exposés semblables. En imposant un même plan, une même manière de traiter le sujet, on n'aurait abouti à donner que l'illusion du parailélisme. L'essentiel était démarquer, pour chaque domaine, l'état actuel des connaissances. Les auteurs n'y pouvaient parvenir qu'à la condition d'avoir leur liberté et de conformer leur exposé aux conditions propres de leur discipline spéciale.
        Les indications données sur les limites des langues et sur la statistique ne visent pas à la précision ; il n'est
[VIII]   
utile de donner des nombres précis que là où le sujet admet la précision, et où les recherches ont été faites avec exactitude. Or, il y a beaucoup de domaines linguistiques troubles, de régions où il se parle plusieurs langues, ou bien où les dialectes n'ont pas de limites arrêtées. Le degré d'unité linguistique varie d'un pays à l'autre. Deux sujets parlant l'arabe, l'un du Maroc, l'autre de Syrie, s'entendent plus ou moins ; mais, en employant chacun, leur parler, ils ne sauraient guère se comprendre qu'a près accommodation; pourtant l'un et l'autre sont dits de langue arabe. Dans toute la France on comprend le français ; mais un paysan provençal qui emploie dans sa famille le parler, local et qui ne parle le français qu'avec un fort «accent », est-il de langue française au même titre qu'un bourgeois de Paris qui emploie, uniquement le français commun ? La variété des cas exclut toute sta tistique rigoureuse ; et, même dans la mesure où une statistique serait possible, elle n'a été faite nulle part d'une manière précise, nuancée — et désintéressée. Seule, une enquête dirigée par des linguistes sans parti pris national permettrait une statistique véritable, et la dif ficulté en serait extrême. Il n'y a pas une région dont l'état linguistique ait été décrit d'une manière com plète.
        Aucun lecteur ne se posera sans doute la question naïve du nombre de langues ou de familles de langues existant dans le monde.
        Il y a autant de parlers distincts qu'il y a de localités et, dans ces localités, de groupes ayant une autonomie. Il n'y a qu'un français littéraire, mais le français varie d'une localité du domaine français à l'autre.
[IX]               
        Quant aux familles de langues, le nombre s'en réduit, au fur et à mesure que les recherches s'approfondissent.
        Et il suffit d'avoir compris la définition même du terme « famille de langues » pour apercevoir aussitôt qu'une famille n'est jamais comparable à aucune autre. Une famille de langues se définit, on le sait, par une langue commune initiale ; mais ces langues communes ne sont pas contemporaines les unes des autres : le bantou commun est assurément beaucoup plus récent que l'indo-européen commun, lequel est, suivant toute apparence, plus récent que le sémitique commun.
        Les précisions de la linguistique ne sont pas de celles qui s'énoncent par des nombres.
        Les noms de certains idionies dont il n'y avait rien a dire, sinon, qu'ils font partie de tel ou tel ensemble, figurent seulement à l'index, celui-ci visant à être complet— sans qu'on se flatte d'avoir approché de cet idéal.
        La variété des sujets — et des auteurs — a empêché d'unifier le mode de références bibliographiques.Chaque partie est à, cet égard indépendante.
        L'index qui indiqué toutes les mentions de chaque idiome a permis de supprimer à l'intérieur du volume les références d'un chapitre à l'autre.

        Les cartes qui figurent ici sont une nouveauté dans un ouvrage sur l'ensemble des langues. La nécessité en était évidente. Elles ne sont pas aussi satisfaisantes qu'on aurait pu le désirer. Ce n'est du reste que dans un nombre de cas relativement restreint qu'on aurait pu marquer exactement la coexistence de plusieurs langues sur un même
[X]      
domaine, la densité de la population parlant chaque langue, le degré d'unité de chaque idiome, etc. Il y a de ce côté un progrès immense à faire.
        Outre les linguistes français qui ont bien voulu délaisser leurs occupations propres pour se rendre à mon appel, je tiens à remercier deux savants russes, M. Elisséèv et le prince N. Troubetzkoy, dont la collaboration a été précieuse.
        M. Marcel Cohen a, dès le début, accepté d'être le secrétaire de la rédaction. Il a rempli ses fonctions avec tout le zèle possible, unifiant l'aspect du livre autant qu'il était désirable, revoyant les épreuves et surveillant tout. Sans lui, le livre n'existerait pas.
        Il a fallu à l'éditeur Champion beaucoup de courage pour entreprendre une publication aussi coûteuse. Il a déjà rendu trop de services à la linguistique pour qu'on soit surpris de cette nouvelle preuve de son dévouement a la science. L'imprimerie Protat s'est acquittée d'un travail difficile avec sa maîtrise ordinaire. Nous remercions l'éditeur et l'imprimeur; nous espérons que le public leur saura gré de leur effort.

         A. Meillet.

[1]      
        INTRODUCTION
        La trop fameuse classification en langues isolantes, agglutinantes et flexionnelles ne se laisse pas poursuivre exactement, et, pour autant qu'elle se laisse formuler, elle n'a ni portée scientifique ni utilité pratique.
        La seule classification linguistique qui ait une valeur et une utilité est la classification généalogique; fondée sur l'histoire des langues. C'est celle qui fournira le plan du présent ouvrage.
        Le principe en est connu : lorsqu'une langue est parlée sur un domaine étendu et que les individus qui l'emploient viennent à cesser d'avoir les relations régulières et continues qui maintenaient l'unité de langue, les changements qui ont lieu dans les diverses parties du domaine ne sont pas identiques; et, au bout d'un temps, variable suivant les cas, les différences entre les parlers locaux qui continuent la langue d'abord commune deviennent telles que les occupants des diverses régions cessent de se comprendre aisément entre eux. Dans la mesure où les habitants de provinces différentes cessent de se comprendre, on peut dire que la langue commune est remplacée par des langues nouvelles.
        Ainsi le latin, qui était la langue commune de la partie occidentale de l'Empire romain, s'est développé de manières différentes dans les diverses parties de l'Italie, de la péninsule hispanique, de la Gaule, etc., à partir du moment où la civilisation antique s'est disloquée. Et, sans qu'ils se soient à aucun moment rendu compte du fait qu'ils ne parlaient plus latin, les habitants des diverses régions se sont trouvés employer des langues nettement distinctes les unes des autres — et toutes très
[2]      
différentes du latin — au IXe siècle après J.-C. Les parlers italiens, hispaniques, gallo-romans, rhéto-romans, roumains sont tous du latin, mais du latin qui a évolué de manières diverses.
        Les évolutions divergentes subies par le latin ont eu lieu à date historique. Des évolutions divergentes du même type ont eu lieu à des moments sur lesquels on n'a aucun témoignage histo rique. Mais les faits linguistiques suffisent souvent à l'indiquer. Par exemple, les concordances qu'on observe entre le sanskrit, la langue de l'Avesta, le grec ancien, le latin ancien, le vieil irlan dais, le gotique, le vieux slave, l'ancien arménien, etc., ne peuvent s'expliquer si ces diverses langues ne résultent pas d'évolutions diverses d'une seule et même langue, dite indo- européenne.
        De là résulte la définition des termes : famille de langues et langues parentes.
        Une famille de langues est l'ensemble des parlers plus ou moins différenciés entre eux qui continuent une même langue commune. Ainsi la famille romane ou néo-latine est l'ensemble des langues qui sont des formes diversement évoluées du latin. La famille indo-européenne est l'ensemble des langues qui sont des formes diversement évoluées de l'indo-européen.
        Des parlers parents, des langues parentes sont des parlers, des langues qui font partie d'une famille ainsi définie.
        Cette définition est purement historique. Elle n'implique entre les langues considérées aucune concordance ni de type général ni de détail. Il subsiste d'ordinaire des concordances, et souvent de très considérables. Mais on n'en peut jamais prévoir l'étendue ni le caractère particulier.
        Des langues parentes peuvent différer entre elles au point que la parenté ne soit plus reconnaissable à aucun trait. Par exemple, entre le polonais et l'anglais actuels, les ressemblances sont très petites et dans la structure d'ensemble et dans le détail. On sait néanmoins que l'anglais et le polonais appartiennent à un même, groupe : le groupe indo-européen ; mais c'est parce que l'on peut établir, par des procédés indirects, que l'un et l'autre résultent d'une série de transformations qui ont eu lieu de manière
[3]      
continue entre l'indo-européen commun et l'anglais d'une part, le polonais de l'autre.
        A l'intérieur d'une même famille, il peut se constituer des familles nouvelles. Une langue qui est une forme évoluée d'une langue antérieure peut se différencier à son tour en langues diverses. De même que l'indo-européen s'est différencié en indo-iranien, grec, latin, germanique, etc., le latin s'est différencié en italien, espagnol, portugais, provençal, français, etc. ; le germanique s'est différencié en gotique, scandinave, allemand, anglais, etc.
        Dès lors, il est impossible d'établir que deux langues ne sont pas parentes. Il est aisé de montrer que le flamand n'a aucun des caractères auxquels on reconnaît une langue romane. Mais le flamand est une langue germanique, donc l'une des langues indo-européennes; il est donc indo-européen comme les langues romanes, qui sont du latin évolué. La parenté n'est pas la parenté proche des langues romanes ; c'est la parenté indo-européenne, plus lointaine. Dès lors, le fait que le finno-ougrien et l'indo-européen sont très différents ne prouve pas que les deux groupes ne continuent pas un original commun, beaucoup plus éloigné dans le passé.
        Toute classification généalogique des langues exprime seulement le fait historique d'une communauté linguistique ayant existé à un moment du passé. On peut donc toujours imaginer que, en montant plus haut dans le passé, on découvrirait une communauté linguistique à laquelle se rattacheraient deux langues ou deux groupes de langues qui ne se laissent pas expliquer par les communautés linguistiques actuellement déterminées.
        Le difficile est de faire la preuve.
        Toutes choses égales d'ailleurs, il y a chance pour que deux langues parentes divergent d'autant plus qu'elles sont séparées depuis plus longtemps. Par suite, la preuve d'une parenté de langues est plus difficile à administrer au fur et à mesure que la communauté supposée est plus loin de l'époque où sont attestées les langues à considérer.
[4]                
        Il est facile de prouver que les langues romanes sont parentes entre elles, parce que, entre la période où le latin a commencé à se briser en parlers divers et les plus anciens, textes des langues romanes, il ne s'est écoulé que peu de siècles. Et, si l'on est bien éclairé sur la parenté des langues indo-européennes entre elles, c'est que l'on a, sur plusieurs de ces langues, des données de plusieurs siècles antérieures à l'époque chrétienne et, pour presque toutes, des données antérieures au xe siècle après J.-C. Si l'on devait faire la théorie des langues indo-européennes seulement avec les formes actuelles de ces langues, on en apercevrait la parenté ; mais il serait impossible d'en construire une grammaire comparée précise comme on le fait grâce aux anciens monuments qu'on possède de diverses langues.
        Or, pour la plus grande partie des langues du monde, les données dont on dispose sont le plus souvent ou peu anciennes ou seulement modernes. Ces données permettent de déterminer des communautés qui remontent à un nombre restreint de siècles dans le passé. Mais, là où il faudrait admettre des communautés de beaucoup antérieures à la communauté indo-européenne ou à la communauté sémitique, les changements intervenus entre ces périodes, qu'on devrait supposer antérieures de plusieurs millénaires à l'ère chrétienne, et l'époque actuelle sont tellement profonds que toute démonstration devient illusoire.
        Du reste, la classification généalogique a d'autant moins de valeur, soit pour permettre l'étude historique des langues, soit pour en faciliter. l'apprentissage, que les langues considérées conservent moins de traits communs. Si, ne connaissant de l'anglais, du français, du polonais et de l'arménien que les formes actuelles, on devait faire l'histoire de ces langues à l'aide de la seule comparaison, on n'irait évidemment pas loin; et, de savoir que ces quatre langues sont des formes diverses prises par un même idiome, parlé il y a quatre ou cinq mille ans, n'aiderait ni à les parler ni à en comprendre le développement. Intéressante pour l'historien, cette conclusion ne serait guère utile directement au linguiste.
        Si le fait que certaines langues sont des formes prises avec le
[5]      
temps par une langue commune est une donnée précieuse pour l'histoire, il n'en faut pas, même à ce point de vue, exagérer la portée.
        Dans toute langue, il y a lieu de considérer, à côté du fonds transmis au cours des générations, les forces— pour la plupart inconnues — qui ont déterminé les changements. Le français est du latin transformé. Mais la transformation a été radicale : par la structure générale comme par le détail, le français est très différent du latin; par suite, les forces d'où vient la transformation entrent dans l'état actuel du français pour une part qui ne se laisse ni mesurer ni même évaluer approximativement, mais qui dépasse en importance la part de l'élément latin ancien. Les linguistes insistent sur l'état de choses initial, en l'espèce sur le latin, parce qu'ils le connaissent plus ou moins, soit par des témoignages directs — c'est le cas du latin —, soit par des procédés comparatifs ; ils ne parlent guère des forces de transformation, parce que jusqu'ici, on n'est pas arrivé à se former d'idées précises à ce sujet. Mais il ne faut pas se laisser abuser par l'imperfection actuelle des connaissances.
        D'ailleurs, il y a une part de la langue — et souvent une très large part — dont la classification, généalogique ne tient pas compte. Ce sont les emprunts. Qui voudrait expliquer l'ensemble du vocabulaire français actuel par le développement du « latin vulgaire » d'époque impériale, se trouverait devant un reste énorme dont il ne pourrait rien faire : la plus grande partie du vocabulaire français a été « empruntée » au latin des livres, ancien ou médiéval, et à des langues diverses : allemand, arabe, italien, espagnol, anglais, etc. Toutes les fois que, par suite d'altérations internes de la langue ou du besoin d'exprimer des notions nouvelles, il a fallu au français des mots nouveaux, ces mots ont été pris systématiquement au latin écrit, et adaptés pour la forme et pour le sens; ainsi le latin écrit, ancien et médiéval, entre dans la composition du vocabulaire français moderne pour autant ou pour plus que le «roman commun» (le latin vulgaire) des romanistes. À une époque plus récente, le vocabulaire grec a été largement mis à contribution. La structure des phrases a
[6]      
aussi subi des influences étrangères, surtout celle du latin écrit.
        L’« emprunt » est particulièrement visible là où il est fait à une langue de type tout différent; ainsi le persan actuel, qui est une langue indo-européenne, doit à peu près tout son vocabulaire des choses de l'esprit à l'arabe, qui est une langue sémitique.

                   * * *

        La part de la langue qui se maintient de génération en génération en se transformant progressivement est le système grammatical. Sans doute la morphologie latine est loin de la morphologie indo-européenne, et la morphologie française, loin du système latin; il y a là trois structures distinctes. Mais beaucoup de particularités du système latin se retrouvent en français, et beaucoup de particularités du système indoeuropéen se retrouvent en latin. Et de plus, on voit comment le système français est sorti du système latin, et le système latin du système indo-européen. Il y a une continuité dans la morphologie, et c'est cette continuité qui permet le classement. Le classement généalogique est fondé sur la continuité de la morphologie.
        On reconnaît la parenté à des détails comme la concordance de il est, ils sont, en français, er ist, sie sind, en allemand, beaucoup plus qu'à des ressemblances de structure générale. C'est donc avec les formes « fortes » et surtout avec les formes anomales des langues indo-européennes attestées, qu'on parvient à retrouver la norme de l'indo-européen, et par suite, à poser la grammaire comparée de l'ensemble du groupe. Et en effet, du fait des influences subies, la structure morphologique est sujette à changer du tout au tout : le français ou l'anglais ont des structures plus proches de celle du chinois que de celle de l'indo-européen. Il résulte de là que l'examen du type linguistique général ne fournit pas le moyen d'établir un classement généalogique des langues. On en peut tirer tout au plus une indication. C'est ainsi que, malgré la ressemblance de type général, on a cessé de former une famille unissant le turco-mongol au finno-ougrien.
[7]                
        Le système phonique, beaucoup moins stable que le système morphologique, a cependant aussi une certaine fixité et fournit des indications utiles.
        En revanche, le vocabulaire est sujet à des innovations brusques et capricieuses. Il traduit des influences de civilisation, plutôt que la continuité linguistique, exprimée par le classement généalogique. Sans doute, il se conserve en général un nombre plus ou moins grand de vieux mots usuels, souvent des verbes tels que ceux signifiant « boire » et « manger », « aller » et « venir », etc. et des adjectifs, souvent aussi des substantifs comme les noms de parenté, d'animaux familiers, etc. Mais ce qui concerne la vie sociale, la vie intellectuelle est sujet à l'emprunt. Les termes de civilisation sont fournis en grande partie par de grandes langues de culture qui servent à de vastes domaines et qui souvent ne sont pas de la même famille que les langues auxquelles elles fournissent des mots.
        Ainsi la civilisation grecque, qui a fourni la base de la civili sation occidentale moderne, a donné au latin beaucoup de mots, et surtout le grec a servi de modèle aux lettrés qui ont con stitué la langue latine écrite. Directement ou indirectement, le grec a été la source ou le modèle de tous les vocabulaires savants qui se sont établis depuis le début de l'ère chrétienne sur tout le bassin méditerranéen.
        L'arabe est la source où s'alimentent tous les vocabulaires des peuples de religion islamique.
        L'Inde a exercé sur l'Asie centrale, l'Indo-Chine, la Malaisie une forte action, surtout grâce à l'extension du bouddhisme. Le persan a, depuis le Xe siècle, beaucoup agi en Asie centrale et jusque dans l'Inde.
        En Extrême-Orient, c'est le chinois qu'on voit fournir le vocabulaire de civilisation à l'Annam, à la Corée, au Japon, par exemple.
        Le nombre de ces grandes langues de civilisation est petit et l'influence de chacune a été immense.
        Les alphabets employés indiquent en général quelles sont les influences de ce genre qui se sont exercées. L'extension des
[8]      
alphabets cunéiformes, grec (et latin, dérivé du grec), araméen, arabe, indien, chinois donne une première indication sur les zones d'influence de chaque langue de civilisation.
        En somme les trois principaux types de faits avec lesquels on opère sont en premier lieu la continuité linguistique, qui se manifeste surtout dans le système morphologique et sur laquelle repose toute la classification généalogique — en second lieu, les influences qui ont déterminé les changements (ces influences sont presque toujours non déterminées jusqu'ici, il est vrai, et le présent ouvrage n'en pourra presque pas faire état, mais l'importance en est capitale) — en troisième lieu, l'action des langues de civilisation dont relèvent en grande partie les faits relatifs au vocabulaire.

                   * * *

        Qu'il s'agisse de l'extension des langues communes, d'où résultent les familles de langues définies, ou des grandes séries d'emprunts, qui caractérisent le type d'influence de culture, les deux faits dominants qu'on vient d'indiquer, à savoir la langue commune initiale et la langue qui fournit les mots empruntés, traduisent des faits de civilisation : la langue qui se répand est, en général, celle du groupe qui apporte le principe d'organisation sociale, et la langue ou les langues qui fournissent les emprunts sont celles par lesquelles s'exprime, la culture.
        Ces grands faits sont ceux qu'on observe dans les cas clairs, ceux qui traduisent des influences de civilisation agissant avec force et avec amplitude.
        Mais il peut y avoir des situations plus complexes.
        Toutes les familles de langues bien, établies supposent un même type de développement historique : extension d'une langue commune sur un large domaine, puis différenciation de cette langue, lorsque disparaissent les conditions qui avaient déterminé l'unification. Cette extension suppose l'existence d'une nation possédant une civilisation propre, et ayant conscience de sa force, de son originalité. Elle résulte du prestige qu'a eu cette nation.
[9]                
        Pareil type de faits s'est souvent réalisé dans le passé, et on le voit se réaliser encore aujourd'hui ; car l'extension des langues communes est un trait frappant du monde actuel. Le français commun par exemple remplace les anciens parlers locaux qui s'éliminent. L'anglais s'étend sur le monde. La grande extension des langues indo-européennes tient à ce que, parlées par une nation douée du sens de l'organisation et de la domination, elles se sont peu à peu substituées à un grand nombre d'autres langues, comme on le voit en Italie pour le latin. L'extension des langues sémitiques, de l'assyro-babylonien, de l'hébréo-phénicien, de l'araméen, et, depuis le VIIème siècle après J.-C, de l'arabe, est un fait qu'on suit historiquement.
        Mais il n'est pas évident que les choses se soient partout passées de cette manière. Il peut s'être produit des mélanges de populations plus troubles, en des conditions moins simples. Dès lors, on ne saurait appliquer à toutes les langues les procédés de comparaison qui sont de mise là où il y a eu extension d'une langue commune, comme il est arrivé pour l'indo-européen, le sémitique, le finno-ougrien, l'indonésien, le bantou par exemple. On peut se demander par exemple si les langues américaines, encore mal connues, pour la plupart et peu étudiées au point de vue comparatif, se prêteront jamais à l'établissement de gram maires comparées précises et complètes ; les sondages faits jusqu'ici promettent peu.
        Dans les langues où le système morphologique ne comporte pas de formations obtenues par des variations compliquées des mots, comme celles d'Extrême-Orient ou certains idiomes soudanais, on peut se représenter de véritables mélanges de langues. Au contraire une langue comme le latin ne peut se mélanger à aucune autre : on emploie ou on n'emploie pas la morphologie latine; si on l'emploie, on parle latin, quelque vocabulaire qu'on y joigne ; si on ne l'emploie pas, on ne parle pas latin, même quand le vocabulaire est purement latin. Mais il est concevable qu'une langue telle que l'annamite, où toute la grammaire consiste dans la manière de grouper des mots invariables, puisse se mêler à une autre. Par suite, dans les cas de ce genre, non
[10]    
seulement il est presque impossible d'établir une classification généalogique et de la démontrer, faute d'avoir des données morphologiques par lesquelles seules la preuve se laisse administrer avec rigueur; mais il n'est même pas évident que le principe de la classification généalogique s'applique. Ce doute doit être signalé, bien que, en fait, partout où l'on a des données suffisantes, les langues — quelque soit le degré de civilisation de ceux qui les parlent — semblent se ramener de plus en plus à un petit nombre d'origines communes, au fur et à mesure qu'elles sont mieux étudiées.
        Exprimant des faits historiques de types divers, la classification généalogique des langues ne saurait être homogène. Le sens du mot parenté de langues, varie donc d'un groupe linguistique à l'autre, d'une langue à l'autre, d'un parler à l'autre. Essayer de faire une classification exacte et complète de toutes les langues en familles rigoureusement définies, c'est montrer déjà qu'on n'a pas compris le principe de la classification généalogique des langues.
        En beaucoup de cas, les données dont on dispose sont du reste i nsuffisantes. Qu'il s’agisse d'Afrique, d'Amérique ou d'Aus tralie, il y a nombre de langues dont la morphologie est mal décrite, ou même ne l'a jamais été. Pour situer ces langues, on est alors réduit à constater des ressemblances de vocabulaire et de type phonique, moins probantes par nature que ne sont les détails grammaticaux définis avec lesquels on démontre la réa lité des familles indo-européenne, sémitique, finno-ougrienne, bantou, etc.
        Une certaine unité de procédés phoniques indique déjà parfois parenté. Ainsi les langues indo-européennes n'offrent guère les consonnes laryngales, qui sont au contraire courantes en sémitique. Il y a, dans les concordances de ce genre, sinon une preuve solide, du moins une indication. Quand une indication phonique est confirmée par des concordances nettes et systématiques de vocabulaire portant sur des mots anciens peu sujets à l'emprunt, on peut considérer la parenté comme probable.
        Enfin les lacunes qui subsistent dans la classification généalo-
[11]    
gique des langues tiennent en une large mesure à l'insuffisance des descriptions et des études comparatives faites jusqu'ici; on n'en pourra mesurer la portée réelle que le jour où les recherches auront été poussées beaucoup plus avant.
        En effet, faute d'études complètes et approfondies, bien des parentés de langues restent à établir, qu'on entrevoit seulement aujourd'hui. De plus, beaucoup de langues sont mal décrites ; pour une notable partie des langues africaines, américaines, australiennes, on ne possède que des vocabulaires ; la grammaire en est presque inconnue. Là même où l'on a des descriptions relativement complètes, le travail de comparaison est à peine amorcé le plus souvent.

                   * * *

        Il n'entre pas dans le plan d'un manuel aussi bref que celui-ci de discuter la question difficile et controversée des rapports entre les grandes familles établies. Il a été produit des faits qui tendent à établir une parenté entre le sémitique et l'indo-européen, entre le finno-ougrien et l'indo-européen. Dans les deux cas, les rapprochements portent bien plus sur le vocabulaire que sur la morphologie proprement dite. L'hypothèse d'une parenté lointaine de l'indo-européen, des anciennes langues asiatiques (lycien, carien, etc.), du caucasique, du finno-ougrien et du chamito-sémitique n'a rien d'invraisemblable, et l'on conçoit la possibilité d'une langue commune dont toutes ces langues seraient des transformations diverses. Mais les traits de cette langue commune sont si peu dessinés qu'il serait prématuré de rien affirmer, et, par suite, d'en faire état ici. La démonstration est rendue malaisée par le fait que la morphologie compliquée de l'indo-européen, par exemple, semble résulter d'un développement relativement récent, et que, par suite, on n'a guère de chance d'en retrouver les éléments en sémitique ou en finno-ougrien. Or la parenté de langue perd son sens, on l'a vu, là où ne se reconnaissent pas des continuités de formes grammaticales,
        A plus forte raison, il convient de laisser en suspens la ques-
[12]    
tion de l'unité d'origine du langage humain et, bien entendu, par là même celle de l'origine du langage.
        La parité des conditions anatomiques, physiologiques et psychiques dans les divers types humains est telle que les traits essentiels de structure sont sensiblement les mêmes partout : tous les hommes se servent de procédés phoniques semblables en gros, tous parlent par mots groupés de diverses manières. Le détail varie ; le fond des procédés linguistiques est le même dans toute l'humanité. Dès lors, il est malaisé de prouver que quelques ressemblances de détail qui ne se ramènent pas à des systèmes morphologiques définis par des faits particuliers, établissent une parenté entre certaines langues. Ici, on ne fera état que des parentés établies par une grammaire comparée au moins esquissée dans ses grandes lignes ou, à défaut de témoignages précis sur la grammaire, par des groupes cohérents de rapprochements frappants de mots, peu empruntables en général et par des ressemblances du type phonétique.
        Néanmoins, il apparaît dès maintenant que la plupart des langues se rattachent à un petit nombre de familles définies ; ainsi presque toutes les langues de l'Europe et une partie de celles de l'Asie appartiennent au groupe indo-européen. Toutes les langues du sud de l'Afrique, sauf le hottentot, appartiennent au groupe bantou ; et l'on entrevoit que toutes les langues des populations nègres seraient parentes entre elles. C'est dire que. à des dates historiques ou proches de l'époque historique, un nombre restreint de langues communes s'est étendu. Le fait n'a rien de surprenant : les langues sont faites pour communiquer ; elles rendent d'autant plus de services qu'elles permettent de communiquer avec plus d'hommes. Les hommes ne cessent donc de réagir contre l'émiettement linguistique, qui résulte des événements historiques et de l'emploi des langues.
        Du reste, les langues actuellement conservées et dont il subsiste des documents écrits ne représentent pas tous les types qui ont pu exister. On connaît, par des textes plus ou moins étendus ou par quelques témoignages, beaucoup de langues qui ont cessé de se parler au cours de l'époque historique. En Italie, par exemple,
[13]    
l'étrusque, le vénète, le messapien, le sicule, dont il subsiste des inscriptions, ont disparu, ainsi que les parlers osques et ombriens apparentés au latin. Toutes les anciennes langues de l'Asie antérieure plus ou moins connues par des textes, babylonien, hittite, carien, lydien, lycien, phrygien, ont disparu sans laisser de survivances, et du syriaque il ne subsiste que quelques parlers dispersés. De même qu'il y a des races d'hommes éteintes, bien des familles de langues se sont évanouies, et leur disparition a effacé des transitions qui seraient utiles pour établir les rapports entre les langues conservées.
        Les langues qu'on n'arrive pas à grouper peuvent être les débris de groupes dont tous les autres représentants sont sortis de l'usage, et dont rien n'est attesté, hormis une seule langue conservée par hasard.
        On sait combien la période historique de l'humanité est courte par rapport aux périodes préhistoriques. La classification généalogique fait ressortir quelques groupements qui résultent d'événements historiques des derniers millénaires de l'humanité. Elles ne permettent même pas d'entrevoir ce qui s'est passé dans des millénaires bien antérieurs, au temps lointain où l'humanité a constitué le langage, instrument essentiel de la vie sociale et du développement industriel et intellectuel.
        Si l'on est loin de pouvoir grouper toutes les langues communes, et si surtout la grammaire comparée des groupes, même les mieux connus, est imparfaite, si le groupe indo-européen est le seul où le travail soit très avancé, si hors du sémitique, du finno-ougrien, de l'indonésien et du bantou, presque tout le travail comparatif reste à faire, il va de soi que la question de l'unité d'origine, sinon du langage humain, du moins des langues actuellement connues, ne peut être abordée d'une manière utile.

                   * * *

        La terminologie linguistique est peu fixée et peu précise : il y a lieu de définir les termes de langue (idiome), dialecte, parler, patois, langtte, spéciale, argot.
[14]   
           
        Le mot langue, au sens large, est le plus général : il désigne tout un ensemble de moyens linguistiques employés par un groupe d'hommes, quelle que soit l'étendue de ce groupe et quelle qu'en soit la valeur au point de vue de la civilisation. Il faut compter autant de langues (on dit aussi idiomes) qu'il y a d'ensembles de ce genre, assez différents pour que les divers sujets parlants qui les emploient ne se comprennent pas sans apprentissage.
        Cette limite d'intelligibilité est absolue en beaucoup de cas ; un sujet parlant chinois, arabe ou anglais est inintelligible pour un sujet connaissant seulement le français. Mais un sujet employant la manière de parler en usage dans un village picard est à demi intelligible pour un Parisien. Entre l'inintelligibjlrté absolue et l'intelligibilité absolue, il y a tous les degrés possibles. Dans un groupe étendu, tel qu'est celui du groupe employant des parlers locaux du type français, les gens de localités voisines s'entendent d'une manière plus ou moins complète, alors que des sujets de régions éloignées ne s'entendent nullement; ainsi un sujet parlant normand n'entend pas un sujet employant un parler local franc-comtois ou wallon.
        On entend par parler l'ensemble des moyens linguistiques employés par un groupe local à l'intérieur d'un groupe occupant une aire étendue. Il y a les parlers français dans la France septentrionale, les parlers provençaux, gascons, etc. dans la France méridionale, les parlers italiens eh Italie, etc. Les parlers locaux sont souvent nommés patois.
        Dans la mesure où le mot langue s'oppose au mot parler, il désigne un ensemble de procédés définis, et dont on a conscience, en somme. Ainsi, chacun des parlers français est un ensemble d'usages locaux, qui varient sensiblement suivant les individus; ces usages oscillent autour d'une moyenne, et ils offrent en gros une régularité, suivant des règles d'usage qui sont souvent très fixes ; mais ces règles ne sont codifiées nulle part. Au contraire, le français est une langue commune qui a des règles rigoureusement fixées, une tradition littéraire. Le français s'oppose ainsi aux parlers français. Ainsi entendu, le mot langue a un sens très élastique.
[15]
        DIALECTES, LANGUES SPECIALES
        La pratique comporte un flottement suivant les classes sociales, suivant les conditions d'emploi (langue parlée et langue écrite), etc.
        À l'intérieur d'un groupe linguistique étendu, on constate, en générai, que certains parlers offrent des traits communs et que les sujets parlants de certaines régions, ont le sentiment d'appar tenir à un même sous-groupe : en pareil cas, on dit que ces parlers font partie d'un même dialecte. On peut ainsi grouper 
les parlers français : parlers français proprement dits (Ile de
France), picards, wallons, normands, champenois, lorrains, 
bourguignons, franc-comtois, etc. Cette notion est fuyante. On
 ne peut le plus souvent assigner de limite précise au dialecte, 
parce que chacune des particularités par lesquelles se caractérisent 
les dialectes, a en général une limite propre, différente de celle 
de toute autre particularité. Un dialecte se reconnaît à ce que 
les limites d'un certain nombre de particularités, sans concorder
 exactement, sont proches les unes des autres, si bien que ce
 groupe de parlers constituant un dialecte offre des traits com
muns.
        Parmi les sujets employant une même langue ou un même parler, il existe souvent — en dehors des différences locales — des groupements d'individus qui offrent certaines particularités linguistiques : les gens qui exercent une même profession, qui font partie de mêmes groupements peuvent constituer des langues spéciales. D'ordinaire ces langues ne se distinguent pas de la langue générale par la prononciation ou par la morphologie. Les particularités portent sur le vocabulaire presque uniquement.
        Les vocabulaires de petits groupes, doublant plus ou moins largement le vocabulaire de la langue commune, sont souvent nommés argots ; ce terme s'emploie surtout pour les parlers de malfaiteurs ou de gens suspects; mais on en étend souvent aussi le sens; et l'on parle de l’argot de la caserne, de telle ou telle école, etc.
        En outre, il y a langue spéciale là où une profession, un groupement particulier exigent l'emploi de termes techniques; c'est ce qui arrive dans les divers métiers, dans les sports, etc.
        Enfin, il faudrait tenir compte des formes altérées que
[16]    
prennent des langues employées d'une manière imparfaite par des gens qui ne cherchent pas à les parler d'une manière normale.. Ainsi les esclaves nègres des colonies n'ont pas cherché à par ler normalement le français ou l'espagnol de leurs maîtres ; les parlers « créoles » usités — espagnols ou français — sont ainsi de l'espagnol ou du français, privés de presque toute leur grammaire, affaiblis dans leur prononciation, réduits à un petit vocabulaire. En Extrême-Orient, des gens de parlers divers se servent, notamment dans leurs relations avec les Européens, d'un anglais dégénéré qu'on appelle le pidgin-english. Dans le 
bassin de la Méditerrannée, il y a des langues, ainsi réduites, 
qu'on nomme des sabirs.
        Les langues de cette sorte ont un minimum de grammaire, et elles sont sujettes à toutes sortes de mélanges. Si elles venaient à se fixer dans l'usage, elles auraient une place à part dans la classification généalogique : fondée sur l'histoire, cette classification doit présenter les rapports de manières diverses, là où les rapports sont divers.
        Il est naturellement impossible de faire entrer dans la clas sification les langues artificielles, telles que le volapük, l'espé ranto, l'ido. Ces langues — dont aucune n'est vraiment entrée dans l'usage — n'ont du reste obtenu de succès que dans la mesure où elles sont une moyenne entre des langues parlées par ceux à qui elles sont destinées. Le vocabulaire de celles des langues qui semblent susceptibles de servir de base à un développement réel, l'espéranto et l'ido, est fait systématiquement avec des termes communs au plus grand nombre possible des grandes langues européennes ; il en résulte que, en fait, leur vocabulaire est sur tout latin et que ces langues artificielles sont proches des langues romanes. Ainsi on revient toujours à la classification généalo gique.

                   * * *

        On verra, par les exposés qui suivent, combien la classification est encore imparfaite, et pourquoi elle est destinée à le
[17] demeurer. Pour faire une bonne classification généalogique, il faudrait pouvoir suivre l'histoire linguistique de chaque domaine, en marquant toutes les influences subies, depuis le moment où le langage s'est constitué. Or, même dans les cas les meilleurs, on entrevoit à peine quelques moments récents de cette histoire. Ainsi, pour la France, on sait que le gaulois s'est propagé par l’effet de la conquête celtique, qui date du premier millénaire avant l'ère chrétienne, que le latin s'y est introduit durant les premiers siècles de l'ère chrétienne. Mais on ne sait de quels idiomes le gaulois a pris la place, ni quelles langues autres que le gaulois subsistaient lors de la conquête romaine. Quant aux langues parlées avant la conquête gauloise, on en ignore tout, et le fait que beaucoup de noms de lieu de la Gaule ne se laissent pas interpréter par le celtique et ne sont sans doute pas celtiques, est le seul témoignage linguistique attestant l'existence en Gaule de parlers antérieurs au gaulois.
        La grammaire comparée des langues indo-européennes fournit à l'ensemble de la linguistique historique un modèle à imiter. En dépit de lacunes immenses et d'insuffisances visibles, ce qui a été obtenu sur ce domaine demeurera sans doute un idéal inaccessible dans la plupart des autres cas. Mais il reste beaucoup à trouver partout. Dans le présent livre il y a donc un programme de recherches plus qu'une somme de résultats. Le travail qui reste à faire est immense, et il ne pourra être fait que si des ressources considérables sont mises aux mains des linguistes.

                   A. Meillet.

              BIBLIOGRAPHIE

        Les deux thèses opposées dans la théorie de la classification généalogique sont exposées l'une, du point de vue du développement des langues communes dont le sujet parlant a conscience, dans :

A. Meillet, Linguistique historique et linguistique générale,, Paris 1921, p. 76-109 (en tenant compte des chapitres précédents et suivants)

l'autre, en partie du point de vue des langues « mixtes », dans :

H. Schuchardt, Sprachverwandtschaft, paru en 1917 dans les Sitzungsberichte de l'Académie de Berlin ; reproduit maintenant, pour l'essentiel, dans

Hugo Schuchardt-Brevier, Halle, 1922, p. 167 et suiv. ; on tiendra compte
 de ce qui précède et de ce qui suit dans le recueil Schuchardt.

Ces idées sont discutées avec sagacité dans :

J. Vendryes, Le langage, Paris 1921, p. 349 et suiv.

Les classifications a priori sont indiquées et critiquées brièvement, mais de manière suffisante, dans un ouvrage fait malheureusement pour soutenu la thèse de l'unité d'origine des langues :

TROMBETTi, Elementi di glottologia. Bologne, 1922-1923, p. 6 et suiv.,

et dans :

O. Jespersen, Language, Londres, 1922, p. 76 et suiv.

Le livre de M. Jespersen comporte une discussion, très personnelle, de
 presque tous les faits envisagés dans cette introduction.

On devra aussi tenir grand compte de :

E. Sapir, Language, New York, 1921, p. 204-235.