La diversité des langues humaines peut être comparée aux branches d’un arbre. Si vous lisez ceci en anglais, vous êtes sur une branche qui remonte à un ancêtre commun avec les Écossais, qui remonte à un ancêtre plus éloigné qui s’est séparé en allemand et en néerlandais. Plus loin, il y a la branche européenne qui a donné naissance au germanique ; Celtique; Albanais; les langues slaves ; les langues romanes comme l’italien et l’espagnol ; Arménien; Baltique; et grec hellénique. Avant cette branche, et quelque 5 000 ans dans l’histoire de l’humanité, il y a l’indo-européen – une proto-langue majeure qui s’est divisée en la branche européenne d’un côté, et de l’autre, l’ancêtre indo-iranien du persan moderne, du népalais, du bengali, Hindi, et bien d’autres.
L’un des objectifs déterminants de la linguistique historique est de cartographier l’ascendance des langues modernes aussi loin que possible – peut-être, certains linguistes l’espèrent, à un seul ancêtre commun qui constituerait le tronc de l’arbre métaphorique. Mais alors que de nombreuses connexions passionnantes ont été suggérées sur la base de comparaisons systémiques de données de la plupart des langues du monde, une grande partie du travail, qui remonte aux années 1800, a été sujette à des erreurs. Les linguistes débattent encore sur la structure interne de familles aussi bien établies que les indo-européennes, et sur l’existence même de familles chronologiquement plus profondes et plus grandes.
Pour tester quelles branches résistent au poids de l’examen, une équipe de chercheurs associée au programme Evolution of Human Languages utilise une nouvelle technique pour passer au peigne fin les données et reconstruire les principales branches de l’arbre linguistique. Dans deux articles récents, ils examinent la famille indo-européenne d’environ 5 000 ans, qui a été bien étudiée, et une branche plus ténue et plus ancienne connue sous le nom de macrofamille altaïque, dont on pense qu’elle relie les ancêtres linguistiques de langues aussi éloignées. comme le turc, le mongol, le coréen et le japonais.
“Plus vous voulez remonter dans le temps, moins vous pouvez vous fier aux méthodes classiques de comparaison des langues pour trouver des corrélats significatifs”, explique le co-auteur George Starostin, professeur externe au Santa Fe Institute basé à la Higher School of Economics de Moscou. . Il explique que l’un des principaux défis lors de la comparaison entre les langues est de distinguer les mots qui ont des sons et des significations similaires parce qu’ils pourraient descendre d’un ancêtre commun, de ceux qui sont similaires parce que leurs cultures s’empruntent des termes dans un passé plus récent.
« Nous devons atteindre la couche la plus profonde de la langue pour identifier son ascendance parce que les couches externes, elles, sont contaminées. Ils sont facilement corrompus par les remplacements et les emprunts », dit-il.
Pour puiser dans les couches fondamentales du langage, l’équipe de Starostin commence par une liste établie de concepts fondamentaux et universels issus de l’expérience humaine. Il comprend des significations telles que «roche», «feu», «nuage», «deux», «main» et «humain» parmi 110 concepts au total. À partir de cette liste, les chercheurs utilisent ensuite des méthodes classiques de reconstruction linguistique pour trouver un certain nombre de formes de mots qu’ils associent ensuite à des significations spécifiques de la liste. L’approche, baptisée «reconstruction onomasiologique, » diffère notamment des approches traditionnelles de la linguistique comparée car elle se concentre sur la recherche des mots utilisés pour exprimer un sens donné dans la proto-langue, plutôt que sur la reconstruction des formes phonétiques de ces mots et leur association avec un vague nuage de significations.
Leur dernière reclassification de la famille indo-européenne, qui applique le principe onomasiologique et a été publiée dans la revue Linguistique, ont confirmé des généalogies bien documentées dans la littérature. Des recherches similaires sur le groupe linguistique altaïque eurasien, dont la proto-langue remonte à environ 8 000 ans, ont confirmé un signal positif d’une relation entre la plupart des principales branches de l’altaïque – turc, mongolique, toungouse et japonais. Cependant, il n’a pas réussi à reproduire une relation précédemment publiée entre le coréen et les autres langues du groupe altaïque. Cela pourrait signifier que les nouveaux critères étaient trop stricts ou (moins probable) que les regroupements précédents étaient incorrects.
Alors que les chercheurs testent et reconstruisent les branches du langage humain, l’un des objectifs ultimes est de comprendre les chemins évolutifs que les langues suivent au fil des générations, tout comme les biologistes évolutionnistes le font pour les organismes vivants.
« L’un des avantages de la reconstruction historique des langues est qu’elle est capable de faire ressortir beaucoup d’informations culturelles », déclare Starostin. « Reconstruire sa phylogénie interne, comme nous le faisons dans ces études, est la première étape d’une procédure beaucoup plus large consistant à essayer de reconstruire une grande partie du stock lexical de cette langue, y compris son lexique culturel. »
Les références:
« Le test de permutation appliqué aux reconstructions lexicales soutient partiellement la macrofamille linguistique altaïque » par Alexei S. Kassian, George Starostin, Ilya M. Egorov, Ekaterina S. Logunova et Anna V. Dybo, 1 juin 2021, Sciences humaines évolutives.
DOI : 10.1017/ehs.2021.28
« Radiation rapide des langues indo-européennes internes : une approche avancée de la lexicostatistique indo-européenne » par Alexei S. Kassian, Mikhail Zhivlov, George Starostin, Artem A. Trofimov, Petr A. Kocharov, Anna Kuritsyna et Mikhail N. Saenko, 18 juin 2021, Linguistique.
DOI : 10.1515 / ling-2020-0060