Saltar a: navegación, buscar

Idiomas indoeuropeos

(Redirigido desde «Lenguas indoeuropeas»)
Idiomas indoeuropeos
Distribución geográfica: Global
Países:
Hablantes: ~45 % de la población mundial[1]
Filiación genética:
Subdivisiones: anatolio
greco-armenio
tracio-dacio-albanés
italo-celta
germánico
balto-eslavo
indoiranio
tocario
ISO 639-1
ISO 639-2 ine
ISO 639-3
IE countries.svg
Véase también:
Idioma - Familias - Clasificación de lenguas

Los idiomas indoeuropeos son la mayor familia de lenguas del mundo en número de hablantes. La familia indoeuropea, a la que pertenecen la mayoría de los idiomas de Europa y sur de Asia, incluye más de 150 idiomas hablados por alrededor de 3200 millones de personas (aproximadamente un 45 % de la población mundial).[1] De estas, unos 1200 millones corresponden a hablantes de las lenguas indoiranias y unos 950 millones de hablantes de las lenguas románicas.

Identificación de la familia

La primera hipótesis sobre la existencia de una familia lingüística indoeuropea fue propuesta en la segunda mitad del siglo XVIII por el filólogo británico sir William Jones, quien notó similitudes entre cuatro de los idiomas conocidos más antiguos: el sánscrito, el latín, el griego y el persa. Franz Bopp apoyó esta hipótesis al comparar sistemáticamente estas lenguas con otras y encontrar múltiples cognados. Desde el siglo XIX, los estudiosos llamaron a esta familia lenguas indogermánicas. Posteriormente pasó a emplearse el término indoeuropeo (excepto en alemán). Un buen ejemplo de la conexión indoeuropea es la enorme similitud descubierta entre el sánscrito y dialectos antiguos del lituano.

El idioma común ancestral se conoce como protoindoeuropeo. Existe desacuerdo en torno al punto geográfico en el que se originó (Urheimat), siendo los principales lugares propuestos Armenia, el sudeste de Ucrania, Kurgal, la India o Irán.

Esta familia está formada por las siguientes subfamilias: albanesa, armenia, báltica, céltica, eslava, germánica, griega, indoirania (que incluye las lenguas indoarias y las iranias) e itálica (que incluye el latín y las lenguas románicas). A ellas se suman dos subfamilias hoy desaparecidas: la anatolia (que incluye la lengua de los hititas) y la tocaria. Desde la segunda mitad del siglo XVIII, y durante todo el siglo XIX, la lingüística histórica y la neogramática intentaron reunir datos suficientes para demostrar que este conjunto de lenguas, aparentemente diversas, formaban parte de una única familia.

Los documentos del sánscrito y del griego clásico (los más antiguos de los idiomas indoeuropeas si exceptuamos los hititas, que por entonces no estaban descifrados) presentan las formas características propias de los idiomas indoeuropeas, lo que demuestra la existencia de una lengua madre común. Las relaciones entre el sánscrito, el griego clásico y el latín se habían comprobado ya hacia principios del siglo XIX.

Por otro lado, los gramáticos de la India elaboraron una clasificación sistemática de los elementos que constituyeron antiguamente el sánscrito. El estudio realizado en la India se completa con otro estudio sistemático y comparativo de los sistemas fonéticos y gramaticales de los idiomas europeos.

La conclusión de este esfuerzo conjunto fue el establecimiento de la existencia del protoindoeuropeo, lengua madre común a los idiomas estudiados, efectuándose una reconstrucción de los rasgos fonéticos y gramaticales que éste debía tener. El indoeuropeo es, pues, una lengua reconstruida y fechada hacia el 3000 a. n. e., puesto que hacia el 2000 a. n. e. ya se encuentran rasgos de diferenciación notables entre los idiomas nacidos del mismo.

En general, los idiomas indoeuropeos muestran una pérdida progresiva de la flexión. Por lo que se sabe, el protoindoeuropeo fue una lengua muy flexiva, como lo demuestran otras lenguas clásicas, como el sánscrito, el avéstico y el griego. Frente a esto, los idiomas modernos, tras un largo proceso evolutivo, están orientados hacia una vía analítica, como por ejemplo el inglés, el francés y el persa, usando complementos con preposición y verbos auxiliares en lugar de la declinación nominal y la conjugación verbal.

En gran parte, la pérdida de los elementos flexivos ha sido el resultado de un largo proceso que ha conducido a la pérdida de las sílabas finales de las palabras; así, muchas de las indoeuropeas eran más breves que las correspondientes protoindoeuropeas. Además, en otras lenguas ha tenido lugar el desarrollo de nuevos procedimientos gramaticales y ha habido numerosos cambios de significado en algunas palabras concretas.

Características comunes

El protoindoeuropeo presenta muchos rasgos que han desaparecido de la mayoría de los idiomas indoeuropeos modernos. De hecho, entre los idiomas indoeuropeos se encuentran tipologías gramaticales que los hacen muy diferentes entre sí, no siendo cierto que todas los idiomas indoeuropeos conserven actualmente "parecido" entre sí, y su relación filogenética muchas veces solo es accesible mediante el estudio comparado profundo de las mismas y no por su aspecto superficial o las características gramaticales más evidentes. Esto se debe a que estas lenguas han seguido evoluciones marcadamente diferentes en cada región donde se hablan. Sin embargo, se reconocen algunas características casi universales en todas ellas:

  • los idiomas indoeuropeos son idiomas altamente fusionantes.
  • El alineamiento morfosintáctico es de tipo nominativo-acusativo.
  • La categoría gramatical de número se marca obligatoriamente tanto en los nombres y pronombres como en las formas personales del verbo. La mayoría de los idiomas distinguen solo singular y plural, aunque algunas lenguas poseen también dual.
  • La gran mayoría de los idiomas indoeuropeos poseen algún tipo de distinción de género gramatical, si bien algunas lenguas como el inglés restringen esta distinción a los pronombres personales y en otras lenguas, como el armenio y el persa moderno, las distinciones de género gramatical han desaparecido por completo.

Género gramatical

El sánscrito, el latín y el griego clásico distinguían entre tres géneros gramaticales: masculino, femenino y neutro. Aunque muchas lenguas indoeuropeas más modernas han perdido alguno de estos tres géneros, en las lenguas romances (con la excepción del asturleonés), las lenguas celtas modernas y las lenguas bálticas, el género neutro se ha asimilado al masculino o al femenino. En holandés y los idiomas escandinavos, el femenino ha desaparecido manteniéndose la oposición entre masculino y neutro. En inglés, la distinción de género solo existe en los pronombres de tercera persona de singular (marginalmente cuando el referente es un vehículo o un país puede usarse she para referirse a ellos), aunque en inglés antiguo el género también existía en los demostrativos y el artículo. Algunas lenguas modernas, como el armenio, han perdido completamente la distinción de género tanto en el nombre como en el pronombre.[2] En muchas lenguas iranias modernas existen solo dos géneros: en persa moderno solo existe distinción entre género humano y no humano y en pashto entre masculino y femenino.[3] También muchas lenguas índicas han perdido alguno de los tres géneros presentes en sánscrito, el hindi-urdu[4] solo diferencia entre masculino y femenino, habiéndose perdido el neutro. En bengalí la pérdida ha ido más allá y la distinción de género ya no existe, o más exactamente no es morfológicamente productiva, aunque hay residuos en el léxico.

El número de géneros en el indoeuropeo más antiguo reconstruible es dudoso, ya que parece que las lenguas anatolias más antiguas solo reflejan una distinción entre género animado y género inanimado en el adjetivo. Rodríguez Adrados ha propuesto que esta es la distinción más antigua y secundariamente apareció en el resto de las ramas también el género femenino.[5]

Número gramatical

En el estadio más antiguo de los idiomas indoiranios, griegos, eslavos y celtas existían tres posibilidades para el número: singular, dual y plural. En las otras ramas de la familia se registran solo dos números: singular y plural ―marginalmente en latín se tiene vīgintī (el número 20) con terminación de dual―. Actualmente el dual ha desaparecido de todas las ramas de la familia indoeuropea, excepto entre las lenguas eslavas.

Se ha reconstruido al antecesor de todo el indoeuropeo no anatolio (pIE-II) como una lengua en la que habrían existido tres números, como en las ramas indoirania y griega. Sin embargo, el anatolio solo testimonia dos números, por lo que probablemente el protoindoeuropeo común (pIE-I) habría sido una lengua con solo dos números, siendo la creación del dual una innovación posterior del indoeuropeo no anatolio.

Caso gramatical

Los idiomas indoeuropeos más antiguos de todas las ramas de la familia (griego micénico, hitita, sánscrito, latín, antiguo irlandés, eslavo eclesiástico, etc.) son lenguas flexivas con un sistema de 5 a 8 casos morfológicos. El número de casos del protoindoeuropeo es materia de debate porque no está claro que el sistema máximo de casos con caso nominativo, vocativo, acusativo, genitivo, dativo, ablativo, locativo e instrumental que encontramos en sánscrito se remonte enteramente al estadio más antiguo reconstruible. De hecho, algunos autores argumentan que existen residuos de un pre-protoindoeuropeo no flexivo anterior al protoindoeuropeo común.[6]

Muchas lenguas indoeuropeas modernas, sin embargo, han perdido gran parte del sistema de casos y la conjugación que caracterizaban a los idiomas indoeuropeos más antiguos. Así, entre los idiomas romances, derivados del latín, solo el rumano conserva un sistema reducido de casos. Las lenguas germánicas igualmente han reducido el número de casos con formas distintivas, habiendo desaparecido en inglés por completo las marcas de caso específicas en el sustantivo. Las lenguas indoiranias han sufrido asimismo una acusada disminución del número de casos. El hindi-urdu posee un sistema de solo tres casos directo o nominativo, vocativo y oblicuo o preposicional. Una situación similar se da en muchas lenguas iranias, como el pashtún de Afganistán. El griego moderno también ha reducido el número de casos respecto al griego clásico, pero junto con las lenguas eslavas y el lituano forma parte de los idiomas indoeuropeos con una flexión nominal con mayor número de casos distintos.

Conjugación verbal

El sistema verbal de la mayoría de las ramas del indoeuropeo parece haber sufrido más cambios que el sistema de flexión nominal. Por esa razón, la reconstrucción se ha basado más en las terminaciones y las marcas morfológicas que en las categorías representadas.

Antes del descubrimiento de las lenguas anatolias y su parentesco con los idiomas indoeuropeos, el sistema verbal reconstruido para el protoindoeuropeo se basaba ampliamente en el griego y en el sánscrito. Este sistema reconstruido constaría de:

  • Cuatro modos: indicativo, subjuntivo, imperativo e infinitivo.
  • Dos voces: voz activa y voz media.
  • Tiempos gramaticales derivados de tres formas de la raíz, dependientes del aspecto gramatical: formas de imperfecto, formas de perfecto y formas de aoristo.

Este sistema maximal, llamado modelo grecoario o indogriego, fue considerado el resultado de innovaciones tardías cuando se conoció mejor el sistema verbal del anatolio. El sistema verbal del indoeuropeo más antiguo resulta, sin embargo, de difícil reconstrucción, ya que el anatolio presenta un sistema verbal mucho más simple y es, por tanto, imposible distinguir hasta qué punto se debe a pérdida de modos o tiempos o hasta qué punto el sistema de los idiomas con una conjugación más amplia es el resultado de innovaciones.

En los idiomas modernos, especialmente en los europeos, han aparecido numerosas formas verbales basadas en verbos auxiliares y perífrasis. Así, los idiomas romances y los germánicos, como el inglés o el alemán, han perdido las formas sintéticas de la voz pasiva y las formas de perfecto, presentes en lenguas antiguas como el latín o el gótico, habiendo sido substituidas con formas perifrásticas con los verbos 'ser' y 'haber'.


Comparación léxica

El léxico común heredado es la evidencia más clara del parentesco genético entre los idiomas indoeuropeos. El trabajo a partir del método comparativo ha permitido compilar diccionarios con varios miles de términos reconstruidos (precedidos de *). La siguiente tabla da los numerales reconstruidos para diferentes ramas de la familia:

[[proto-IE PROTO-
GERMÁNICO
PROTO-
ITÁLICO
PROTO-
CELTA
PROTO-
BÁLTICO
antiguo
eslavo
PROTO-
ALBANÉS
PROTO-
INDOIRANIO
PROTO-
ANATOLIO
PROTO-
GRIEGO
PROTO-
ARMENIO
PROTO-
TOCARIO
1 *oynos *ainaz *oino *oinos *oīns jedĭnŭ *(ai)ɲa *aiwas *ānt *hemei- *mik *ṣēs
2 *dwō *twai *duō *dwei *dw(ā)i dŭva *dui *dwā *dā- *dwō *tgu *wu
3 *treyes *θreiz *trejes *treis *trijas trĭje *tre(ye) *trayas *tri- *tri *erek' *treyɨ
4 *kʷetwor- *fiθwor *kʷetwōr *kʷetwar- *keturi četyre *katur *ćatwaras *mewi- *qettar- *ć'eyork' ɨtwerɨ
5 *penkʷe *fimf- *kʷenkʷe *kʷenkʷe *penki pętĭ *penće *panća *panku *pente *pink *pɨnśɨ
6 *sweks *seks *seks *sweχ *sweši šestĭ *skes- *šwaćs *hweks *hweć' *ṣɨks
7 *septm *sibun *septm *seχtan *septīni sedmĭ *septa- *sapta *hepta *hewt'm *šɨptɨ
8 *h3oktō *ahtō *oktō *oχtū *aštōni osmĭ *(ak)te- *aštā *haktau *oktō *ut' *oktɨ
9 *newn *niwun *newn *nawan *newīni devętĭ *nan- *nawa *nu- *ennewa *inn *ñɨwɨ
10 *deḱm *tehun *dekm *dekam *dešīmt- desętĭ *ðeć- *daća *deka *desm *śɨkɨ

Clasificación de los idiomas indoeuropeos

Tradicionalmente, el indoeuropeo se clasificaba en dos grupos: lenguas satem y lenguas centum, que recibieron esos nombres dependiendo de si la serie de fonemas velares protoindoeuropeos /*k, *g, *gh/ se palatalizaba (*kntom '[el número] 100' es en avéstico satem) o no (*kntom dio en latín centum). Sin embargo, hoy en día no se concede apenas importancia al cambio (uno entre tantos), ni se cree que sea un criterio sólido que clasifique adecuadamente a los idiomas indoeuropeos. De hecho, varias clasificaciones que tratan de reconstruir el árbol cladístico de los idiomas indoeuropeos ni siquiera consideran a los idiomas satem como una rama propiamente.[7][8] Eso sugiere que la palatalización se extendió entre lo que eran diferentes ramas de la familia.

La primera rama que se separó del tronco común fue la rama anatolia y algo más tarde la rama tocaria, ambas ramas están actualmente extintas (sin descendientes hablados actualmente). Estas dos ramas no presentan la típica palatalización de los idiomas satem, incluso cuando el tocario es una rama "oriental". De hecho es la única lengua oriental que no palataliza, lo cual sugiere que la palatalización en la que se basa la división centum / satem es relativamente tardía. Las subdivisiones restantes son algo más discutidas, aunque parece claro que el griego, el armenio y probablemente otras lenguas paleobalcánicas formarían juntas una subdivisión. Esta rama greco-armenia incluye tanto lenguas satem como lenguas centum, razón por la cual se considera que la división satem-centum no es adecuada, dado que ninguna de las dos subdivisiones serían ramas cladísticas propiamente dichas.

Divisiones principales del indoeuropeo

Las relaciones internas entre estos grupos de último nivel son algo más complicadas y polémicas y todavía existen discrepancias menores. Por ejemplo, aunque universalmente se reconoce una especial relación entre el grupo griego y algunas lenguas paleobalcánicas (en particular el armenio), no está claro por ejemplo si las lenguas indoarias se formaron por una división de un hipotético protoindoeslavo o, por el contrario, deben considerarse el resultado de la escisión de un hipotético protoindogriego. Y problemas similares se encuentran con los idiomas germánicos, los idiomas eslavos, los idiomas celtas o los idiomas itálicos.

Recientemente han aparecido dos intentos de clasificación interna agrupando los subgrupos básicos anteriores: El árbol filogenético de Gray-Atkinson (The 'New Zealand' family tree, 2003) y el árbol filogenético de Ringe-Warnow-Taylor (The 'Pennsylvania' family tree, 2002). El primero se basa estrictamente en léxico compartido y substituido, mientras que el segundo se basa en isoglosas fonológicas y morfológicas. Aunque ambas clasificaciones presentan algunos puntos comunes, también difieren de manera importante en otros detalles. Las ramas marcadas con (†) corresponden a ramas o lenguas extintas que dejaron de tener hablantes nativos. El árbol de Gray-Atkinson tiene la siguiente forma:[9]

proto-IE1

anatolias (†) 


proto-IE2

tocarias (†) 


IE-nuclear
greco-armenias

griegas



armenias






albanés


indoiranias

indoarias



iranias




antiguo europeo
balto-eslavas

bálticas



eslavas





germánicas




itálicas



celtas









El árbol de Ringe-Warnow-Taylor, que deja fuera a los idiomas germánicos, ya que considerarlas implica que no existe un árbol de ajuste óptimo (es decir, filogenéticamente perfecto), tiene la siguiente forma:[10]

proto-IE1

anatolias (†) 


proto-IE2

tocarias (†) 




albanés


IE-nuclear
italo-celtas

celtas



itálicas




greco-armenias

griegas



armenias



Satem nuclear
balto-eslavas

eslavas



bálticas



indoiranias

iranias



indoarias









Fuentes