Langues romanes
Les langues romanes, aussi appelées langues latines[2],[3] ou encore langues néo-latines[4],[5],[6], sont un groupe de langues issues du latin vulgaire, plus précisément du latin véhiculaire[7]. Utilisé pour la communication sur toute l'étendue de l'Empire romain, le latin véhiculaire a évolué en plusieurs langues romanes dont trois, le castillan, le français et le portugais, ont connu une expansion mondiale à partir du XVe siècle. La distinction entre langue et dialecte étant assez arbitraire, on peut définir d'une vingtaine à une cinquantaine de langues romanes. Les plus parlées dans le monde sont l'espagnol (480 millions de locuteurs natifs), le français (321)[8], le portugais (227), l'italien (71), le roumain (24) et le catalan (11)[9]. La plupart des autres sont menacées d'extinction. NomRoman est un nom masculin issu de l'ancien français romanz (v. 1135), lui-même issu du bas latin romanice (« à la façon des Romains », par opposition à celle des Barbares), et désignant dès le XIe siècle la langue vernaculaire parlée dans le Nord de la France, par opposition au latin (langue écrite et savante) et au germanique des Francs. La forme adjectivale du substantif roman est relevée au XVIe siècle pour qualifier une langue vernaculaire parlée en Romania, et apparaît en linguistique dans le courant du XVIIIe siècle pour qualifier les langues romanes[10]. Description généraleCes langues ont été parlées ou le sont encore dans un ensemble géographique désigné par le terme de « Romania »[11], désignant la partie européenne des anciens Empires romains occidental et oriental. Les mots « roman(e) » et « Romania » remontent à des dérivés de l'adjectif latin romanus : l'on considérait en effet que leurs locuteurs utilisaient une langue issue de celle des Romains, par opposition à d'autres introduites ultérieurement dans les territoires de l'Empire, comme le francique au nord de la France, langue tudesque des Francs appartenant à la branche des langues germaniques. La première attestation du terme roman remonte au concile de Tours, qui se tient en 813. Lors de ce concile, l'un des cinq réunis cette même année à l'initiative de Charlemagne, il est recommandé aux prêtres de s’adresser à leurs ouailles « in rusticam romanam linguam », le roman. Il s'agit d'une forme vernaculaire, évoluée et corrompue, du bas latin, ancêtre des langues gallo-romanes. Le texte de ce concile est, dans l'état actuel des connaissances, la première source écrite « romane » attestée. Le premier ouvrage mentionnant plusieurs langues romanes est le De Vulgari Eloquentia (« De l'éloquence vulgaire ») de Dante (XIIIe siècle), où l'on trouve les dénominations de langue d'oïl, langue d'oc et de langue de si. Il s'agit pour Dante de proposer, pour remplacer le latin comme langue littéraire, l'une de ces trois langues, la langue d'oïl des chansons de geste, la langue d'oc des troubadours, ou un parler local, le toscan florentin, qui sera finalement à l'origine de l'italien littéraire[12]. On date à peu près l'évolution du latin vulgaire vers les langues romanes de la manière suivante[13] :
Les langues romanes partagent un ensemble de traits communs donnant une bonne cohérence à cette famille de langues, parmi lesquels les plus importants sont :
ClassificationLes langues romanes sont classées en plusieurs groupes, chacun pouvant comprendre plusieurs « dialectes » ; le choix d'un de ces dialectes comme langue officielle est purement politique et, surtout, relativement récent dans de nombreux pays (sauf en France, où les premiers jalons sont posés dès le XVIe siècle par l'édit de Villers-Cotterêts). Quoi qu'il en soit, les langues romanes forment un continuum de langues entre lesquelles les différences sont parfois minimes ; il est toujours possible de distinguer au sein d'un ensemble ce que l'on nommera un ou plusieurs « dialectes ». La liste suivante présente entre parenthèses : nom dans la langue envisagée, date de la première attestation connue. Les similarités lexicales et grammaticales des langues romanes et de leurs dialectes, ainsi qu'entre le latin et chacune d'entre elles, peuvent être mises en évidence à l'aide des exemples suivants :
Les langues romanes sont parfois classées :
Classification traditionnelleTraditionnellement, la classification des langues romanes est effectuée selon des critères géolinguistiques :
Classification moderneMais cette classification tend maintenant à être effectuée selon des critères strictement linguistiques :
Classification cladistiqueUne classification différente, fondée sur le vocabulaire, permet une comparaison systématique (Projet ASJP). On mesure la similarité lexicale telle que la distance de Levenshtein pour une liste de mots apparentés. Dans ce cas les langues regroupées sous l'appellation gallo-romane par Ethnologue.com[15] apparaissent dans des branches différentes de l'arbre cladistique des langues romanes[16][Information douteuse] :
Ce qui précède indique que d'un point de vue lexical, français et franco-provençal, constituent l'une des branches les plus dissemblables des langues romanes. Cela est dû à la forte incidence de la phonologie et du lexique en contact avec les langues germaniques au cours du Bas-Empire romain et le début du Moyen Âge. Peut-être encore plus étonnant en comparaison avec les classifications conventionnelles (historiquement fortement fondées sur la géographie, voire influencées par la division politique, au-delà des traits proprement linguistiques), l'occitan et le catalan sont plus à rapprocher du point de vue du lexique de l'italien et du roumain que des langues ibériques (espagnol, galicien, aragonais). Groupes de langues romanesGroupe gallo-romanLangue d'oïlLa langue d'oïl est considérée, selon la vision traditionnelle de la linguistique romane, comme une seule et même langue, qui correspond principalement à un ensemble de dialectes d'oïl répartis historiquement autour de Paris (dans les faits, la langue française actuelle est très composite et doit beaucoup à une langue littéraire interrégionale). Les langues d'oïl (au pluriel) sont au contraire considérées, selon une autre vision, comme un groupe de langues et le français (au sens restreint) n'est que l'une de ces langues (venue du francien), parmi d'autres. Les langues d'oïl regroupent :
Normanno-picardLa Normandie et la Picardie sont traversées par la ligne Joret[24], qui sépare le domaine septentrional du domaine méridional des langues d'oïl. Le normand du Nord est caractérisé par le maintien du [k] et [g] dur devant « a » (voir Palatalisation /k ɡ/ + /a/ (en)), ainsi que le « chuintement » normanno-picard. Plus anecdotiquement, le normand du Nord a conservé le [w] germanique là où, plus au sud, il a évolué vers [g] gu-. FrancoprovençalLe francoprovençal (XIIIe siècle : Méditations de Marguerite d'Oingt) est répartie entre l'Italie (Vallée d'Aoste, Piémont et les petites colonies de Celle di San Vito et de Faeto en Pouilles), la Suisse (à Fribourg et en Valais principalement), la France (Dauphinois, Lyonnais, Savoie) ; le francoprovençal regroupe différents dialectes plus ou moins proches les uns des autres, les principaux étant :
OccitanL'occitan ou la langue d'oc est tantôt compris dans ce groupe, tantôt inclus dans le groupe occitano-roman. Le francoprovençal a des similitudes avec la langue d'oc et la langue d'oïl plus ou moins marquées en fonction de leur situation géographique. Cette langue est menacée d'extinction (plus ou moins en fonction des dialectes) mais reste défendue, notamment en Vallée d'Aoste et Savoie. La Vallée d'Aoste demeure cependant à ce jour la seule région de l'espace francoprovençal où cette langue est encore largement utilisée dans la vie quotidienne et comme langue maternelle. Groupe occitano-romanOccitanL'occitan ou langue d'oc (en occitan occitan, lenga d'òc ; IXe siècle : traces de vulgarismes occitans dans des textes latins ; fin du Xe siècle : documents juridiques ; 1102 : premier texte complet (Acte d'Ademar Ot)) est constitué de différents dialectes :
L'occitan, sous le nom de limousin ou de provençal à l'époque, a été la langue utilisée dans la littérature et les poésies des troubadours de toute l'Europe. Il a ensuite connu deux renaissances littéraires, l'une avec le Félibrige et Frédéric Mistral au milieu du XIXe siècle, l'autre avec l'occitanisme dans la seconde moitié du XXe siècle. L'unité de l'occitan comme langue est discutée par des linguistes y compris occitanistes (comme Pierre Bec), notamment à propos du catalan (qui en est aujourd'hui séparé) et du gascon-béarnais, mais aussi à propos du provençal et de l'auvergnat[27]. CatalanLe catalan (en catalan català; fin du XIe siècle), très proche de l'occitan, est généralement rattaché au même groupe. Celui-ci, très compact[28], est, selon le linguiste Pierre Bec, intermédiaire entre le groupe gallo-roman incluant l’occitan, le français, le francoprovençal et le romanche, et le groupe ibéro-roman incluant l'aragonais, le castillan (espagnol), l'asturo-léonais, le galicien et le portugais (ensemble galaïco-portugais), mais il possède aussi des caractères propres. Les occitanistes Pierre Bec et Domergue Sumien à sa suite, considèrent l'occitan et le catalan comme une seule langue (autrement dit des éléments d'un même diasystème)[28], dont le catalan serait issu « par élaboration »[29]. Des traces de vulgarismes catalans ont été conservées dans des textes latins ; entre 1080 et 1095, les Homilies d'Organyà, l'un des documents littéraires les plus anciens du catalan ; fin du XIIe siècle : premier texte complet dans un document juridique ; XIIIe siècle : sous l'égide de Ramon Llull, le catalan accède au statut de langue littéraire et de pensée reconnue) : l'une des langues officielles de la Catalogne (Espagne) ; il est parlé principalement dans cette Communauté autonome et dans une frange de l'Aragon, ainsi que dans celle méridionale de Valence (où il est aussi appelé valencien), ainsi qu'aux Îles Baléares (où les variantes locales s'appellent mallorquí, menorquí ou eivissenc), en Andorre (où il est la seule langue officielle), dans le Roussillon (France), aussi connu sous le nom de Catalogne du Nord (en catalan Catalunya del Nord), ainsi que dans la ville de l'Alguer (en Sardaigne). L'usage du catalan, et d'autres langues régionales, a été sévèrement contrôlé et réprimé durant plusieurs périodes, notamment sous le règne de Philippe V et le franquisme. Groupe ibéro-romanCe groupe inclut parfois le catalan.
Groupe italo-romanItalien (italiano ; Xe siècle : documents juridiques ; XIe siècle : texte complet) ; plus de deux cents variantes classées en deux groupes clairement différenciés, séparés par un grand faisceau d'isoglosses le long de la ligne Massa-Senigallia (dite de manière moins exacte « ligne La Spezia-Rimini ») qui correspond à la coupure des langues romanes en deux grands groupes : la Romanie occidentale (incluant l'italien septentrional, les langues gallo-romanes, ibéro-romanes, occitano-romanes et rhéto-romanes) et la Romanie orientale (incluant l'italien centro-méridional et de l'extrême-sud, et les langues romanes orientales)[39]. Cette séparation assez nette entre Romanie occidentale et orientale remet, pour certains linguistes, en cause la pertinence du groupement « italo-roman », qui ne serait plus lié qu'à l'appartenance à un même ensemble géographique : la péninsule italienne et politique : l'Italie.
Cette dialectologie est toutefois sommaire et ne décrit pas avec précision l'extraordinaire diversité, largement conservée, des parlers italiens à proprement parler. SardeLe sarde (sardu, limba sarda ; XIe siècle) est parlé en Sardaigne. C'est une des langues romanes les plus conservatrices, ce qui s’explique par sa situation insulaire[45] ; il a néanmoins connu de nombreuses influences, parmi lesquelles celles du catalan, du castillan puis de l'italien sont les plus notables. Au sein du sarde peuvent être distingués plusieurs dialectes, représentés par deux orthographes principales[46] :
Une tentative de normalisation d'une langue sarde unifiée (Limba Sarda Comuna) est appuyée par la région autonome. Selon les répertoires Ethnologue[47] et Glottolog[48], le corse, dans une forme ancienne et hypothétique, et le sarde auraient formé une branche distincte, appelée « langues romanes méridionales » ou « langues romanes insulaires » ; selon d'autres linguistes, comme Heinrich Lausberg ou Yuri Koryakov, le sarde tel qu’il est parlé au centre et au sud de l’île, est désormais la seule langue vivante de ce groupe, comme il n’existe plus de vieux corse (Old Corsican), entièrement remplacé par la toscanisation, ni de langue romane d'Afrique du Nord, qui sont tous deux éteints. Groupe rhéto-romanCe groupe parlé dans le massif alpin et sur ses piémonts comprend :
Frioulan et ladin n'ont qu'un statut de langue régionale, mais sont reconnus par la Constitution italienne. Certains linguistes, minoritaires, y rattachent l'istriote. Toutes ces langues, morcelées en de multiples dialectes, sont en régression constante, mais la toponymie alpine montre qu'avant le VIIIe siècle elles ont été parlées des sources du Rhin jusqu'à celles des affluents du haut-Danube, dans ce qui est aujourd'hui la Bavière méridionale et le Tyrol[49]. PannonienCette langue romane autrefois parlée en Pannonie (actuelles Hongrie occidentale et Croatie occidentale et septentrionale) comptait environ 200 000 locuteurs vers le IVe siècle[50] et s'est éteinte au Xe siècle, mais a laissé des inscriptions et des ex-voto gravés par les clēricī literātī[51]. DalmateCe groupe éteint au XIXe siècle également appelé illyro-roman est compté parmi les langues romanes orientales, mais ne fait pas partie du diasystème roman de l'Est. Il présente des caractères intermédiaires entre le groupe rhéto-roman et le groupe thraco-roman. Connu au Moyen Âge (fin XIIIe siècle) sous les noms de mavro-valaque, maurovalaque ou morlaque, attesté directement vers 1840, le dalmate est éteint. Parlé autrefois dans les îles dalmates et sur le littoral de Croatie et du Monténégro, il comprenait deux dialectes recensés : le végliote (veklisuṅ, au nord, dans l'île de Krk ou Veglia, dont le dernier locuteur s'est éteint en 1898) et le ragusain (au sud, dans l'actuelle Dubrovnik, éteint dès le XVe siècle). Groupe thraco-romanCe groupe, le plus oriental des langues romanes orientales, est également appelé diasystème roman de l'Est ; parlé dans le bassin du bas-Danube, autour des Carpates et dans les Balkans, il comprend quatre langues vivantes et trois éteintes[52],[53] :
Ces quatre langues vivantes sont issues de l'évolution de trois langues éteintes :
En aroumain et en méglénite, le superstrat slave est moins fort qu'en roumain et istrien, alors que l'influence du grec et de l'albanais est prépondérante. Du latin classique au latin vulgaireQuelques modifications phonétiques propres au latin vulgaireNote : les transcriptions phonétiques sont en alphabet phonétique international. À propos du latin vulgaire, il convient de noter que les Romains, comme les Grecs, vivaient en situation de diglossie : la langue de tous les jours n'était pas le latin classique (celui des textes littéraires ou sermo urbanus, « langue de la ville », c'est-à-dire une langue figée par la grammaire comme l'a été le sanskrit), mais une forme distincte bien que très proche, au développement plus libre (le sermo plebeius, « langue vulgaire »). Il semble acquis que le latin classique ne se limitait pas à un emploi livresque, mais qu'il était couramment parlé par les catégories sociales élevées, bien que ces dernières aient trouvé plus raffiné encore de s'exprimer en grec (et il semble que César n'ait pas dit à Brutus Tu quoque, fili mais Kaì sù, téknon), tandis que le sermo plebeius était la langue des soldats, des commerçants, du petit peuple ; n'ayant jamais accédé au statut de langue littéraire, le latin vulgaire nous est surtout connu par la linguistique historique, des citations et des critiques prononcées par les tenants d'un latin littéraire ainsi que de nombreuses inscriptions, des registres, comptes et autres textes courants. D'autre part, le Satyricon de Pétrone, sorte de « roman » écrit vraisemblablement au Ier siècle et se passant dans les milieux interlopes de la société romaine, est un témoignage important de cette diglossie : selon leur catégorie sociale, les personnages s'y expriment dans une langue plus ou moins proche de l'archétype classique. Parmi les textes qui ont blâmé les formes jugées décadentes et fautives, il faut retenir l’Appendix Probi[54], sorte de compilation d'« erreurs » fréquentes relevées par un certain Probus et datant du IIIe siècle. Ce sont bien ces formes, et non leur équivalent en latin classique, qui sont à l'origine des mots utilisés dans les langues romanes. Voici quelques exemples de « fautes » citées par Probus (selon le modèle A non B, « [dites] A et non B »), classées ici par type d'évolution phonétique et assorties de commentaires permettant de signaler les principales différences phonologiques entre le latin classique et le latin vulgaire ; il n'est bien sûr pas possible d'être exhaustif en la matière et de référencer toutes les différences entre le latin classique et le latin vulgaire, mais l’Appendix Probi peut constituer une introduction pertinente sur le sujet. Calida non caldaCalida non calda, masculus non masclus, tabula non tabla, oculus non oclus, etc. : ces exemples montrent l'amuïssement des voyelles post-toniques (et aussi prétoniques) brèves ; les mots latins sont en effet accentués cálida, másculus, tábula et óculus, la voyelle suivante étant brève. Cet amuïssement prouve aussi que l'accent de hauteur du latin classique est devenu un accent d'intensité en latin vulgaire (en effet, un accent de hauteur n'a pas d'influence sur les voyelles atones environnantes). L'on reconnaît dans cette liste les ancêtres de chaude (ancien français chalt), mâle (ancien français masle), table et œil ; ce processus a donné naissance à des transformations importantes des consonnes entrées en contact après la chute de la voyelle les séparant : ainsi, un /l/ devant consonne est passé à l vélaire (soit /ɫ/) puis à /u/ en français (vocalisation), d'où chaud ; de même, /kl/ a pu donner un l palatalisé (voir au paragraphe suivant). Vinea non viniaVinea non vinia, solea non solia, lancea non lancia, etc. : l'on voit là le passage en latin vulgaire de /e/ bref devant voyelle à /j/ (son initial de yacht ; le phénomène est nommé consonification) qui, après consonne, la palatalise ; ces consonnes palatalisées (qui peuvent provenir d'autres sources), sont importantes dans l'évolution des langues romanes. Cette transformation explique pourquoi l'on obtient, par exemple, vigne (avec /nj/ devenant /ɲ/, noté dans les langues romanes par le digramme gn en français et italien, ñ en espagnol, ny en catalan, nh en portugais et occitan, etc.), seuil (avec anciennement un l palatal, soit /ʎ/, noté par ill/il en français, devenu ensuite un simple /j/, conservé en italien, où il est noté gli et toujours prononcé comme une double consonne, en espagnol, où il est noté ll, « double l » [sauf quand il provient de /lj/, où il passe à /x/, phonème dit jota], comme en catalan, en portugais et occitan, écrit lh, etc.), et lance (avec le son /s/ issu de /t͡s/, forme palatalisée de /k/, que notait bien la lettre c latine ; de même en italien lancia /lantʃa/, espagnol lanza /lanθa/, anciennement lança /lantsa/, ou en roumain lance /lantʃe/, etc.). Auris non oriclaProbus note dans cet exemple plusieurs phénomènes : premièrement la réduction des anciennes diphtongues (ici /au/ devenant /ɔ/, soit o ouvert ; l'on a aussi en latin vulgaire /ae/ donnant /ɛ/, e ouvert, ainsi que /oe/ passant à /e/, e fermé), puis l'utilisation d'une forme de diminutif au lieu de la forme simple (auris « oreille », auricula « petite oreille »). L'utilisation des diminutifs en latin vulgaire est fréquente : ainsi soleil provient de soliculum et non de sol, ou encore genou, primitivement anc. fr. genoil, de genuculum et non de genu. Enfin, on note l'amuïssement du /u/ bref après une voyelle accentuée : on attendrait oricula. Comme on l'a dit au premier paragraphe, la rencontre de c et l, /kl/, causée par la chute de la voyelle les séparant, donne naissance à une nouvelle consonne, ici un l palatal, conservé en catalan dans orella, devenu /j/ en français mais /x/ en espagnol, dans oreja /ɔrexa/). Auctor non autorOn remarque aussi des réductions de groupes de consonnes ; ainsi, /kt/ passe à /t/, donnant en français auteur, ou autor en espagnol, portugais et catalan ; de même, /pt/ passe à /t/. C'est le cas dans dom(i)tare devenu domtar puis domptar et enfin dontar. L'insertion d'un /p/ entre /m/ et une occlusive est normale : on parle d'une épenthèse, donnant en français dompter que l'on prononçait /dõte/ avant que l'orthographe n'influence la prononciation, devenant parfois /dõpte/. Autre simplification : /pt/ donne /t/, comme dans comp(u)tare devenu comptare puis compter et conter /kõte/ en français, contar en espagnol, etc. Rivus non riusRivus non rius, sibilus non sifilus : le son /w/ du latin, noté par la lettre u (ou v dans les éditions modernes) a évolué de manières diverses, soit en s'amuïssant entre voyelles (ri(v)us donnant rio en espagnol, pa(v)or donnant peur, italien paura), en devenant une spirante bilabiale sonore (/β̞/, en espagnol et catalan) puis se renforçant en /v/ (dans la majorité des langues romanes) ; /p/ et /b/ entre voyelles connaissent le même sort, ce qui explique que sibilus donne sifilus, sachant que /f/ n'est que la variante sourde de /v/ ; ainsi explique-t-on siffler (de sibilare, devenant sifilare puis siflare) ou savoir (de sapere, puis sabere, savere ; le espagnol saber montre, par son orthographe, qu'il en est resté au stade /β̞/), etc. Pridem non prideDernier exemple, montrant que le /m/ en fin de mots n'est plus prononcé (ce qui est déjà le cas en latin classique : la scansion du vers latin le prouve facilement). Cet amuïssement est, entre autres, à l'origine de la disparition du mécanisme des flexions : les langues romanes, en effet, n'utilisent plus la déclinaison. Cette liste n'est bien sûr pas exhaustive ; il faudrait aussi aborder la question de la diphtongaison « panromane » (que toutes les langues romanes ont connue) et signaler que nombre de voyelles ont subi par la suite des diphtongaisons secondaires. Transformations en profondeur du système morpho-syntaxiqueSystème nominalLa chute du /m/ final, consonne que l'on rencontre souvent dans la flexion, crée donc une ambiguïté : Romam se prononçant comme Roma, l'on ne peut savoir si le mot est au nominatif, à l'accusatif ou à l'ablatif. Ainsi, les langues romanes ont dû utiliser des prépositions pour lever l'ambiguïté. Plutôt que dire Roma sum (classique Romæ sum avec un locatif que n'a pas gardé le latin vulgaire) pour « je suis à Rome » ou Roma(m) eo pour je vais à Rome, il a fallu exprimer ces deux phrases par sum in Roma et eo ad Roma. À cet égard, il convient de rappeler que si en latin classique déjà, dès l'époque impériale, le /m/ en fin de mots s'amuïssait, Roma sum et Roma(m) eo ne pouvaient être confondus : à l'ablatif (Roma sum), le /a/ final est long ; il est cependant bref à l'accusatif : ainsi l'on prononçait /rōmā/ pour le premier, /rōmă/ pour le second. Le latin vulgaire, toutefois, n'utilise plus le système de quantité vocalique : les deux formes sont d'autant plus ambiguës. Dans un même mouvement, les adverbes et les prépositions simples sont parfois renforcées : ante, « avant », ne suffit plus ; il faut remonter à ab + ante en vulgaire pour expliquer le français avant, le portugais et espagnol antes et l'occitan avans, ou bien in ante pour le roumain înainte, etc. ; de même avec provient de apud + hoc, dans de de intus, etc. Le cas limite semble être atteint avec le français aujourd'hui, notion qui se disait simplement hodie en latin classique. Le terme français s'analyse en en + le + jour + de + hui, où hui vient de hodie (qui a donné hoy en espagnol, "hoje" en portugais, oggi en italien, azi en roumain, uèi en occitan, avui en catalan, hoz en romanche, oûy en wallon, etc.). Le composé agglutiné résultant est donc redondant, puisqu'il signifie mot à mot : « au jour d'aujourd'hui » (qu'on trouve en français familier). Certaines langues conservatrices ont cependant gardé des adverbes et prépositions simples : le espagnol et l'italien con, le portugais com et le roumain cu viennent bien de cum « avec », de même que en espagnol ou în roumain sont hérités de in. L'on constate le même phénomène avec les mots simples hérités de hodie. De langue flexionnelle à la syntaxe souple (l'ordre des mots comptant moins pour le sens que pour le style et la mise en relief), le latin vulgaire est devenu un ensemble de langues utilisant nombre de prépositions, dans lesquelles l'ordre des mots est fixe. S'il est théoriquement possible de dire en latin Petrus Paulum amat, amat Petrus Paulum, Paulum Petrus amat ou encore amat Paulum Petrus pour signifier que « Pierre aime Paul », ce n'est plus possible dans les langues romanes, qui ont plus ou moins rapidement abandonné les déclinaisons ; ainsi, en espagnol Pedro ama a Pablo et Pablo ama a Pedro ont un sens opposé, seul l'ordre des mots indiquant qui est sujet et qui est objet. Lorsque les langues romanes ont gardé un système de déclinaisons, celui-ci est simplifié et se limite à quelques cas (à l'exception du roumain) : c'est ce qui arrive en ancien français, qui n'en possède que deux, le cas sujet (hérité du nominatif) et le cas régime (venant de l'accusatif), pour tout ce qui n'est pas sujet. En français, toujours, le cas sujet a disparu ; les noms actuels hérités de l'ancien français sont donc presque tous d'anciens cas régime (il y a quelques exceptions, comme ancêtre, peintre, traître, anciens cas sujets, et chandeleur, provenant d'un génitif pluriel latin candelorum) et, partant, d'anciens accusatifs ; on peut le constater avec un exemple simple :
Le roumain, toutefois, conserve un système flexionnel fonctionnant avec trois cas syncrétiques : cas direct (nominatif + accusatif), cas oblique (génitif + datif) et vocatif. Ces cas se distinguent principalement si le nom est marqué par l'article défini. Dans le cas contraire, ils ont tendance à être confondus. D'autres points méritent d'être signalés. Tout d'abord, à l'exclusion du roumain, les trois genres, masculin, féminin et neutre, sont réduits à deux par l'élimination du neutre possiblement sous l'effet d'un substrat non indo-européen. Ainsi le mot latin folia, nominatif/accusatif neutre pluriel de folium « feuille », est réinterprété comme un féminin : c'est le cas, par exemple, en français, où il devient feuille, mais aussi en espagnol (hoja), en italien (foglia), en romanche (föglia), en wallon (fouye), en portugais (folha), en catalan (fulla), en occitan (fuèlha), etc., tous mots féminins. De plus les langues romanes ont développé un système d'articles définis inconnu du latin classique, peut-être également sous l'influence d'un substrat résiduel. Ainsi, en français, le et la proviennent respectivement des pronoms/adjectifs démonstratifs ille et illa ; l'évolution est la même en espagnol pour el et la (plus un neutre lo < illud), en italien pour il et la (ainsi que lo, neutre, < illud), etc. Le roumain se distingue en étant la seule langue romane dans laquelle l'article est enclitique : om « un homme », om-ul « l'homme », ce qui s'explique par le fait qu'en latin, l'adjectif démonstratif pouvait précéder ou suivre le substantif (ille homo/homo ille). Les articles indéfinis, pour leur part, proviennent simplement du numéral unus, una (et unum au neutre). Enfin le système de l'adjectif est modifié. Alors que les degrés de l'adjectif étaient marqués par des suffixes, les langues romanes ne se servent plus que d'un adverbe devant l'adjectif simple. Cet adverbe continue soit magis (devenu más en espagnol, mai en occitan et en roumain, mais en portugais, més en catalan, etc.), soit plus (più en italien, plus en français et en occitan, pus en wallon et en catalan ancien ou dialectal, plu en romanche, etc.). Par exemple, plus clair (comparatif de supériorité) se disait en latin classique clarior (dérivé de clarus). En revanche l'espagnol emploie más claro, l'italien più chiaro, l'occitan plus clar ou mai clar, etc. De même le superlatif le plus clair se disait clarissimus en latin classique, mais el más claro en espagnol et il più chiaro en italien. On trouve cependant quelques archaïsmes : le portugais a conservé des mots différents pour le plus grand, o maior, et le plus petit, o menor, comme le castillan avec mayor et menor, comparables, bien que d'emploi très différent, aux majeur et mineur du français. Système verbalEn outre, les conjugaisons sont profondément modifiées, notamment par la création de temps composés : ainsi notre j'ai chanté, espagnol he cantado, italien ho cantato ou encore catalan he cantat, occitan ai cantat, roumain am cântat, viennent d'un habeo cantatu(m) vulgaire, qui n'existe pas en latin classique. L'utilisation de verbes auxiliaires, être et avoir, est notable : le latin utilisait déjà, d'une manière différente, être dans sa conjugaison, mais pas d'une manière aussi systématique que dans les langues romanes, qui ont généralisé leur emploi afin de créer un jeu complet de formes composées répondant aux formes simples. Généralement, les formes composées marquent l'aspect accompli. Un mode nouveau apparaît, le conditionnel (attesté pour la première fois dans une langue romane dans la Séquence de sainte Eulalie), construit à partir de l'infinitif (parfois modifié) suivi des désinences d'imparfait : vivr(e) + -ais donne vivrais en français, et, mutatis mutandis , viviría en espagnol, viuria en catalan, viuriá en occitan. Certaines modifications du radical sont à noter : devoir + ais > devrais et non *devoirais, ou bien haber + ía > habría et non *habería. De la même manière, le futur classique est abandonné au profit d'une formation comparable à celle du conditionnel, c'est-à-dire l'infinitif suivi du verbe avoir (ou précédé en sarde) : ainsi cantare habeo (« j'ai à chanter ») donne chanterai, italien canterò, espagnol cantaré, catalan cantaré, occitan cantarai, etc. Le passif est évacué au profit du système composé qui préexistait en latin (cantatur, « il est chanté », classique devient le vulgaire est cantatus, qui, en classique signifiait « il a été chanté »). Enfin, certaines conjugaisons irrégulières (comme celle de velle, « vouloir ») sont rectifiées (mais restent souvent irrégulières dans les langues romanes) et les verbes déponents cessent d'être utilisés. Le lexique du latin vulgaireLe latin vulgaire et le latin classique ne diffèrent pas seulement par des aspects phonologiques et phonétiques, mais aussi par le lexique ; les langues romanes, en effet, n'utilisent que dans des proportions variables le vocabulaire classique. Souvent, des termes populaires ont été retenus, évinçant ceux propres à la langue plus soutenue. Certains termes latins ont disparu et ont été remplacés par leur équivalent populaire ; c'est le cas de celui qui désigne le cheval, equus en latin classique, mais caballus (« canasson » ; le mot est peut-être d'origine gauloise) en latin vulgaire, que l'on retrouve dans toutes les langues romanes : caballo en castillan, cavall en catalan, caval en occitan, cheval en français, cal en roumain, cavallo en italien, dj'vå en wallon, chavagl en romanche, etc. Mais la jument est appelée iapa en roumain, yegua en castillan, égua en portugais, egua en catalan, et èga en occitan, du latin equa (l'italien emploie aussi giumenta ou cavalla). D'autre part, certains termes classiques disparus n'ont pas forcément été remplacés par le même mot vulgaire dans toute la Romania : le terme soutenu pour « parler » est loqui en latin classique, gardé en roumain (a locui mais avec le sens d'habiter), remplacé par :
Enfin, certaines langues romanes continuent d'utiliser la forme classique, tandis que d'autres, que l'on dit moins « conservatrices », se servent d'une forme vulgaire ; l'exemple donné traditionnellement est celui du verbe « manger » :
Raisons de la diversité des langues romanesL'évolution phonétique naturelle des langues, à laquelle le latin n'a pas échappé, explique en grande partie les différences importantes entre certaines des langues romanes. À ce processus s'est aussi ajouté la non-unicité lexicale de ce que l'on désigne sous le terme de latin vulgaire : la taille de l'Empire romain et l'absence d'une norme littéraire et grammaticale ont permis à cette langue vernaculaire de ne pas être figée. Ainsi, chaque zone de la Romania a utilisé une saveur particulière du latin vulgaire (il vaudrait même mieux dire « des latins vulgaires »), comme on l'a vu plus haut, telle langue préférant tel terme pour signifier « maison » (latin casa en espagnol, catalan, italien, portugais, roumain), telle autre un terme différent (mansio pour le même sens en français), par exemple. S'est greffée à ces deux données la présence de substrats, langues parlées initialement dans une zone et recouvertes par une autre, ne laissant que des traces éparses, tant lexicales ou grammaticales que phonologiques, dans la langue d'arrivée. Ainsi, le substrat gaulois en français lui laisse quelque cent quatre-vingts mots comme braies, char ou bec, et serait à l'origine du passage du /u/ (de loup) latin à /y/ (de lune). Cette hypothèse ne fait cependant pas l'unanimité. Bien entendu, l'influence du gaulois ne s'est pas limitée à la langue française : les dialectes de l'Italie du Nord, par exemple, en possèdent quelques termes, et on a ainsi en italien standard braghe pour braies (qui a donné plus tard les mots français braguette et bretelle), carro pour char, ou becco pour bec. De même le basque pour les langues ibérico-romanes (où le mot pour « gauche », soit sinistra en latin classique, est remplacé par des dérivés du basque ezker, soient esquerra en catalan, izquierda en espagnol et esquerda en portugais)[55] et en particulier l'espagnol. Enfin, les superstrats ont aussi joué un rôle prépondérant dans la différenciation des langues romanes : ce sont les langues de peuples s'étant installés dans un territoire sans réussir à imposer leur langue. Cette dernière a cependant laissé des traces importantes. Le superstrat francique (donc germanique) en France est important ; le vocabulaire médiéval en est émaillé, surtout dans le domaine de la guerre et de la vie rurale (ainsi heaume, adouber, flèche, hache, etc., mais aussi framboise, blé, saule, etc., ou encore garder, guerre et, plus surprenant, trop), et le français actuel compte plusieurs centaines de mots ainsi hérités du francique. C'est un superstrat arabe que l'on remarque le plus en espagnol et en portugais : plus de quatre mille termes, parmi lesquels des toponymes et des composés, viennent de cette langue. Le trait le plus remarquable est le maintien quasi systématique de l'article arabe dans le mot, alors que les autres langues romanes ayant aussi emprunté le même terme s'en sont souvent débarrassées : ainsi les gloses espagnoles algodón (contre l’italien cotone > français coton), de l'arabe أَلْقُطْن, ʾal-quṭn, algarroba (contre le français caroube), de ʾal-harūbah ou encore aduana (contre l’ancien italien doana / dovana > français douane), de أَلدِّيوَان, ʾad-dīwān (qui donne aussi divan). Enfin, dernier superstrat remarquable, le slave, dont l'influence en roumain est notable. Le roumain devrait aux langues slaves alentour son vocatif, 20 % de termes du lexique ainsi que des processus de palatalisation différents de ceux des autres langues romanes. L'influence des langues romanes les unes sur les autres est par ailleurs considérable. On peut donner ici les résultats d'une étude menée par Mario Pei en 1949, qui a comparé le degré d'évolution de diverses langues par rapport à leur langue-mère ; pour les langues romanes les plus importantes, si l'on ne considère que les voyelles toniques, l'on obtient, par rapport au latin, les coefficients d'évolution suivants :
On voit ainsi facilement le degré variable de conservatisme des langues romanes, la plus proche du latin phonétiquement (si l'on ne considère que les voyelles toniques) étant le sarde, la plus éloignée le français. Comparaison lexicale
Degré de similitude du lexique entre les langues romanes
Diffusion mondiale des langues romanesDu fait de la colonisation, l'aire géographique des locuteurs de langues romanes s'étend largement au-delà de l'Europe. Les plus largement diffusées sont l'espagnol (Mexique, Amérique centrale et Amérique du Sud, Philippines, etc.), le portugais (Brésil, Angola, Mozambique, etc.) et le français (Canada, Afrique, etc.). L'espagnol et le français figurent parmi les langues officielles de l'ONU. Les langues romanes parlées par plus de 10 millions de personnes sont l'espagnol, le français, le portugais, l'italien et le roumain (98 % des locuteurs). Il est à noter que l'étendue géographique de l'espagnol, du français et du portugais sont en grande partie le résultat du passé colonial. Dans la plupart des anciennes colonies, le français est la seconde langue, au contraire de l'espagnol et du portugais. Il en résulte que le français est la seconde langue romane en nombre de locuteurs, mais la troisième, derrière le portugais, en locuteurs qui l'ont pour première langue. Le catalan est un cas particulier, puisqu'il n'est pas la langue principale d'un État-nation (il l'est seulement en Andorre), mais il a tout de même été capable de soutenir la concurrence de l'espagnol, et même de gagner des locuteurs, bien que celui-ci soit non seulement la langue de l'État mais aussi l'une des plus importantes du monde. En fait, le catalan est la seule langue minoritaire d'Europe dont la survie à long terme n'est probablement[59] pas en danger. Au contraire de la plupart des langues minoritaires, le catalan n'est pas resté lié à la culture traditionnelle rurale. En effet, la société catalane a été, depuis le Moyen Âge et jusqu'à nos jours, plus dynamique et orientée vers l'Europe et la modernité que celle de Castille, et donc que celle de l'État dominant. D'autre part, une culture de haut niveau, bien qu'ayant abandonné généralement le catalan au XVIIe siècle, ne s'est pas interrompue et a pu reprendre la langue du pays vers la fin du XIXe siècle. En plus, elle a été toujours doublée d'une culture populaire (musique, théâtre, vaudeville, littérature de consommation ou pratique, presse) vivante, qui a suivi l'évolution des temps et s'est toujours produite en catalan. En conséquence, une conscience « nationale » a survécu à l'union des royaumes, accompagnée du sentiment que la langue est une partie fondamentale de l'identité des catalans[60],[59]. Cela a permis au catalan de résister d'une part aux périodes de répression et aux importants flux immigratoires qui ont eu lieu tout au long de l'histoire, et d'autre part aux processus assimilationnistes qui sont en voie de faire disparaître la plupart des langues minoritaires, même lorsqu'elles ont un fort soutien gouvernemental (par exemple l'irlandais). Le reste des langues romanes, avec moins de locuteurs, subsistent principalement pour les rapports informels. Historiquement, les gouvernements ont perçu (voire perçoivent encore) la diversité linguistique comme un obstacle sur les plans économique, administratif ou militaire, de même qu'une source potentielle de mouvements séparatistes; ils se sont donc généralement efforcés de les combattre, moyennant la promotion de la langue officielle, des restrictions quant à leur utilisation au sein des médias, leur caractérisation comme dialectes ou patois (mots devenus péjoratifs), ou même la persécution. En fait, il s'agit plus proprement de langues minorisées que de langues minoritaires. En conséquence, toutes ces langues sont considérées par l'Atlas UNESCO des langues en danger[61] comme menacées à divers degrés allant de « vulnérable » (par exemple le sicilien ou le basque) à « sérieusement en danger » (p.ex. toutes celles parlées en France sauf le basque et le catalan). Dès la fin du XXe siècle, une plus grande sensibilité aux droits des minorités a permis à ces langues d'amorcer une lente récupération de leur prestige et de leurs droits perdus. Cependant, il n'est pas clair que ces processus politiques soient capables d'inverser le déclin des langues romanes minorisées. Influence sur l'anglais
Le normand au nord de la ligne Joret a donné naissance au français anglo-normand, langue jadis parlée à la cour d'Angleterre et qui a exercé une profonde influence sur l'anglais. Notes et références
Voir aussiBibliographieHistoire et aspects généraux
Monographies, manuels universitaires
Articles connexes
Liens externes
|