Curva Fin Bloque
KNOWLEDGE 7 MARZO, 2018

¿Cuántos idiomas se hablan en la India?

La India es el segundo país más poblado del mundo y ya disputa a China el primer lugar. La diferencia actual se estima alrededor de los 50~60 millones de habitantes. Los 1300 millones de indios comparten el inglés y el hindi como lenguas oficiales en todo el país, pero eso no significa que todos sepan hablarlos, ya que hay numerosas lenguas que se utilizan de forma exclusiva.

Este hecho aumenta la dificultad de tener buenas traducciones porque escasean los lingüistas especializados. No nos referimos a expertos en lenguas minoritarias; algunos de estos idiomas tienen más de cien millones de hablantes, otros decenas de millones. Sin embargo, faltan expertos que puedan realizar traducciones fiables. Para entender la situación es recomendable analizar los 22 idiomas oficiales que se reparten por los diferentes estados indios, ver su número de usuarios y sus características.

Después, aportaremos una tabla resumen para tener una idea más gráfica de los datos y terminaremos revisando la presencia de algunas de estas lenguas en Internet. Una red global, pero que hasta ahora sigue dando la espalda a millones de hablantes en todo el mundo.

Empezamos nuestro recorrido con el idioma más hablado en la India: el hindi. A partir de él iremos conociendo otras lenguas ordenadas por el número aproximado de hablantes que tiene cada una.

Taj Mahal in sunset light, Agra, Uttar Pradesh, India

1. Hindi

Una de las dos lenguas nacionales, junto con el inglés. Es el idioma autóctono con mayor número de hablantes en la India y el quinto más hablado del mundo. Hablamos de unos 258 millones de personas que lo tienen como lengua materna, pero también de otros 120 millones que lo usan como segunda lengua. Su uso en todo el mundo supera los 380 millones de hablantes.

El hindi está muy relacionado con el urdu, lengua que también se habla en la India y que es el idioma nacional de Pakistán. Tanto el hindi como el urdu son formas estandarizadas del indostano; de hecho, se pueden entender como dialectos. La diferenciación de ambas lenguas tiene un trasfondo religioso. Mientras el hindi es propio de los hinduistas, el urdu lo utilizan los musulmanes. Si sumamos ambas lenguas, comprensibles entre sí, tendríamos a un total de 474 millones de hablantes, alcanzando el cuarto puesto en el ranking mundial.

En la India, la distribución del hindi es principalmente en el centro y noroeste del país. Sus orígenes se remontan aproximadamente al año 1000 a. C., cuando llegaron las tribus arias al Indostán y se fusionó el sánscrito de los invasores con las lenguas nativas. Esta fusión derivó en el prácrito, un grupo de dialectos del sánscrito. De estos derivados surgieron las siete lenguas arias que se hablan hoy en la India: panjabi, sindhi, marathi, oriya, gujarati, bengalí e hindi.

El hindi también tiene sus dialectos, más de una docena, aunque la mayoría se podrían considerar ya como lenguas independientes porque no son mutuamente inteligibles. Entre ellos están el kanauji, el bundeli, el chamari o el chatisgarí.

2. Bengalí

Otra lengua importante es el bengalí, hablado por 230 millones de personas en el noreste del país. Es lengua oficial de los estados de Bengala Occidental, Tripura y Jharkhand. También se habla en el sur del estado de Assam, además de ser el idioma de Bangladés. Su uso se extiende también a las islas de Andamán y Nicobar.

Derivado del sánscrito, su importancia se hace palpable en el hecho de que los himnos nacionales de Bangladés y la India se han escrito en bengalí por el premio Nobel de Literatura indio, Rabindranath Tagore.

3. Urdu

El tercer idioma más utilizado es el urdu, que cuenta con 104 millones de hablantes en todo el mundo. Diez millones lo hablan en Pakistán, donde es lengua nacional. Su uso en este país se debe a la emigración procedente del norte de la India en el momento en el que se dividió la antigua colonia británica en 1947.

En la India es oficial en los estados de Bihar, Andhra Pradesh y en el de Yamu y Cachemira. Tiene cuatro dialectos: pinhari, rekhta, dakhini y urdu vernáculo moderno. Este último es el utilizado en las ciudades de Lahore y Delhi, donde se encuentra su origen.

4. Panyabí

Se habla en la región del Punyab, que se extiende por tres estados indios (Punyab, Haryana e Himachal Pradesh) y por una provincia pakistaní (también llamada Punyab). Fuera del subcontinente indio se habla en los grupos religiosos sijes repartidos por una veintena de países de todo el mundo. En total, cuenta con unos cien millones de hablantes.

Además de sus diferencias dialectales también tiene dos tipos de escritura, según el dialecto y la religión de sus hablantes. El panyabí de los pakistaníes utiliza la escritura shahmukhi, de estilo árabe; mientras que, en la India, los sijes utilizan el alfabeto gurmukhi y los hindúes suelen usar la grafía de estilo devanagari.

5. Tamil

Alrededor de 77 millones de personas hablan tamil. La comunidad principal se encuentra en Tamil Nadu, un estado del sureste de la India. También se habla en el noroeste de Sri Lanka y, en menor medida, en Vietnam, Singapur y Malasia, donde la educación primaria se imparte en esta lengua. En las islas de Andamán y Nicobar es una de sus cuatro lenguas oficiales.

Es una de las lenguas clásicas de la India y cuenta con una gran producción literaria. Con 2200 años de antigüedad, el tamil es uno de los idiomas más antiguos del mundo.

6. Telugu

Otros 74 millones de personas hablan telugu, aunque si se suman los hablantes no nativos se alcanzan los 80 millones. Su habla es propia, principalmente, de los estados de Andhra Pradesh y Telangana, donde son idiomas oficiales. También se habla en el distrito de Yanam, en otras zonas de los estados vecinos y en comunidades indias de otros países.

El telugu forma parte de las lenguas drávidas surcentrales, junto a gondi, pengo, manda, kui, kuvi y konda. Como en el caso del tamil, la escritura telugu se basa en el alfabeto brahmi. Tiene cuatro dialectos regionales: en nueve distritos de Telangana se habla el dialecto septentrional; al sur se habla el meridional en Nellore, Prakasam y cuatro distritos de Rayalasima; el oriental se habla en el noreste de su zona de influencia, en Srikakulam, Visakhapatanam y Vijayanagaram; el central es utilizado en Godavari oriental y occidental, Guntur y Krishna. También hay otros tres dialectos que se distribuyen por castas sociales: brahman, no brahman y harijan.India_40680672

7. Maratí

El idioma maratí se extiende por un amplio territorio del centro y el oeste de la India, en el estado de Maharastra, cuya capital es la importante ciudad de Bombay. Lo hablan casi 74 millones de personas. Deriva del sánscrito y es muy próximo a la lengua cingalesa propia de Sri Lanka, a pesar de que geográficamente están distantes.

El maratí tiene la singularidad de utilizar numerosos préstamos de otras lenguas, como el urdu, el persa o el árabe.

8. Sindi

Menos hablantes tiene el sindi, aunque supera los 54,3 millones de personas en todo el mundo, principalmente en la provincia pakistaní de Sind, donde alcanzan los 18,5 millones. En la India, su presencia es mucho más escasa, no llega a los dos millones de hablantes nativos, pero es lengua oficial en los estados de Guyarat, Maharastra y Rayastán.

Si el urdu llegó a Pakistán con la emigración de los indios musulmanes, el sindi llegó a la India de la mano de los hindúes pakistaníes en la misma época fundacional de ambas naciones. Hay que recordar que Pakistán se creó como república islámica y la India como república socialista secular, sin religión estatal, aunque el hinduismo estaba muy extendido entre la población.

En el sindi también se utilizan dos alfabetos, según la religión del hablante: los musulmanes usan el árabe modificado y los hindúes el devanagari.

9. Canarés

El idioma canarés es la lengua oficial del estado de Karnataka, que se encuentra al suroeste de la India y cuya capital es Bangalore. Otras zonas donde se habla canarés son los estados vecinos de Andhra Pradesh, Maharastra, Tamil Nadu y Kerala, además de algunas comunidades indias del Reino Unido, Estados Unidos, Australia y Canadá. En total lo hablan unos 52 millones de personas en todo el mundo.

En su fonética, vocabulario y gramática se hacen evidentes las influencias del sánscrito y de sus derivados prácritos. Tiene numerosos dialectos, entre los que destacan el canarés de Bangalore y el de Hubli, otra importante ciudad de Karnataka.

10. Guyaratí

El estado de Guyarat está en la costa oeste de la India, haciendo frontera con Pakistán, y tiene su propio idioma: el guyaratí. Su población supera los 60 millones de habitantes, pero solo algo menos de 46 millones hablan este idioma. También se habla en algunos territorios indios adyacentes, en una parte del sureste pakistaní y en comunidades del Reino Unido y Estados Unidos.

Su alfabeto sigue el modelo abugida, es decir, es un alfabeto silábico en el que las consonantes llevan una vocal de forma inherente. Como dato a destacar, el guyaratí fue la lengua materna de los considerados ‘padres’ de la India (Mahatma Gandhi) y de Pakistán (Muhammad Ali Jinnah). Por otra parte, la lengua guyaratí tiene relevancia porque es oficial en el segundo estado más industrializado de la India, después de Maharastra, y uno de los de mayor crecimiento económico en los últimos años.

11. Malabar

Al sur del estado de Karnataka se encuentra el de Kerala. Situado en el extremo suroeste del país, cuenta con el malabar como lengua oficial. No se utiliza más allá de sus fronteras, pero sus hablantes nativos son más de 35,7 millones.

El malabar es una lengua dravídica muy emparentada con el tamil, ya que tienen un origen común: el antiguo tamil, que hoy en día es una lengua muerta. El malabar es una de las lenguas clásicas de la India, junto al sánscrito, el canarés, el telugu y el oriya.

Este idioma tiene su propio alfabeto, una mezcla de escritura alfabética y silábica que forma parte de la familia de alfabetos bráhmicos. Tiene 20 vocales cortas y largas, 36 consonantes y numerosos símbolos; algunos de estos símbolos proceden de otras lenguas indoarias. Cabe destacar que, históricamente, el idioma malabar se escribía con varios alfabetos. Para facilitar su uso en los teclados, en 1981 se redujo el número de tipografías de 900 a 90.

12. Oriya

El idioma oriya es la lengua oficial del estado de Odisha, al noreste de la India y cuya costa mira al golfo de Bengala. Esta lengua clásica de la India la hablan más de 32 millones de personas (algunas fuentes aumentan este número a 50 millones de hablantes) y también tiene una escritura abugida.

Sus orígenes están en el prácrito denominado ardhamagadhi, un antiguo dialecto del sánscrito. Desde entonces ha recibido influencias de las lenguas dravídicas, el persa, el árabe y el inglés. Además, también ha incorporado préstamos del tamil, telugu, maratí, turco, francés, portugués y hasta del sánscrito actual.

13. Maijilí

El maijilí es el idioma oficial del estado de Bihar, situado al norte de la India y lindante con Nepal. También en este país se habla maijilí en la región de Terai. En total cuenta con casi 30 millones de hablantes.

Pertenece al grupo de lenguas bihari y fue considerado como un dialecto del hindi, pero en 2003 se le concedió el estatus de lengua independiente. Sin embargo, no está considerado como idioma oficial. De hecho, en Bihar los idiomas oficiales son el hindi y el urdu, pero no el maijilí.

Cabe recordar que este estado es uno de los más emblemáticos de la India porque es la cuna de dos de sus religiones más importantes: el budismo y el jainismo. El maijilí (también llamado maithili) está muy relacionado con el hecho religioso. Fue la lengua propia de Mithila, la capital del antiguo reino de Videja, que seguía el estilo de vida ortodoxo de los brahmanes. La población que habla maijilí ronda solo el 25 % de los habitantes de Bihar, pero este idioma conserva un legado literario muy importante.

14. Asamés

El asamés es el idioma oficial del estado indio de Assam, situado en el noreste de la India, pero también se habla en el estado de Arunachal Pradesh y en algunas zonas de Bangladés y Bután. Es una lengua afín al bengalí y el oriya, hablada por casi 20 millones de personas. En su desarrollo se ha visto influenciada por los dialectos tibetano-birmanos de la región. Su gramática no hace distinción de géneros.

15. Nepalí

Como su nombre indica es el idioma oficial de Nepal, pero también del estado menos poblado de la India, Sikkim, que tiene poco más de 600 000 habitantes y está ubicado a los pies del Himalaya. Sin embargo, el nepalí lo hablan 17 millones de personas, contando también a quienes lo tienen como lengua materna en el vecino Reino de Bután.

Su origen, similar al de otras lenguas del norte de la India, está en el sánscrito. Como ellas, también ha tomado préstamos del árabe y del persa a través del hindi y el urdu. Del idioma inglés también ha recogido algunos vocablos. A diferencia del español, el alemán o el inglés, que son lenguas con estructura SVO (sujeto, verbo, objeto), el nepalí es un idioma SOV (sujeto, objeto, verbo), como el latín, el japonés o el euskera. Otro rasgo en común del nepalí con las lenguas derivadas del sánscrito es que utiliza el alfabeto devanagari.

16. Konkaní

Por debajo de los diez millones de hablantes encontramos el idioma konkaní; una de las lenguas oficiales de Goa, un pequeño estado situado en el centro de la costa oeste de la India. Los datos sobre su número de hablantes difieren según las fuentes. Las más prudentes hablan de 2,5 millones y las más optimistas llegan hasta los 7,5 millones de usuarios.

La mayoría de ellos se encuentran en Goa, pero también se habla en Mangalore, importante ciudad portuaria perteneciente al vecino estado de Karnataka. El uso del idioma konkaní se extiende, así mismo, a lo largo de la costa oeste del estado de Maharastra.

Tiene préstamos de las lenguas drávidas, del canarés, el maratí, el persa y el árabe. Además, como Goa fue colonia de Portugal durante 450 años (desde 1510 hasta 1961), el konkaní tiene importantes influencias del portugués. De hecho, junto al konkaní, el portugués también es lengua oficial en este estado, como lo son el inglés, el maratí y el hindi.

17. Santali

Aunque la mayoría de sus hablantes vive en la India, el idioma santali se usa también en tierras de Nepal, Bután y Bangladés. Se estima que tiene alrededor de seis millones de hablantes. En la India, su uso está distribuido por los estados de Assam, Jharkhand, Bihar, Odisha, Tripura y Bengala Occidental; sin embargo, no tiene el rango de oficial en ninguno de ellos.

La característica fundamental de esta lengua es que pertenece a la comunidad tribal más importante de la India. Esto explica que se hable solo en los lugares donde viven los indígenas santales.

El santali forma parte del grupo de lenguas munda de la familia de lenguas austroasiáticas. A diferencia de los idiomas influenciados por el sánscrito, traído por las tribus invasoras arias, las lenguas munda son autóctonas de la península del Indostán. Además del santali, otras lenguas munda destacadas son el mundari y el ho.

18. Cachemir

Menos implantación tiene el idioma cachemir, propio de la región de Cachemira y una de las dos lenguas oficiales del estado indio de Yamu y Cachemira; la otra es el urdu. El cachemir lo hablan alrededor cinco millones de personas y es el máximo exponente de la treintena de lenguas dárdicas que se hablan en el norte de Pakistán, este de Afganistán y el propio estado indio ya mencionado.

Por su estructura es una lengua SVO, como el español y, en la actualidad, se escribe con el alfabeto persa. Aunque fue una lengua muy utilizada por los poetas musulmanes de la era sufí, su uso ha ido decayendo con los años por razones políticas. Prueba de ello es que la India no permite la enseñanza reglada del cachemir en la parte de la región que gobierna y que Pakistán le disputa.

19. Meitei

El meitei es uno de los idiomas oficiales del oriental estado de Manipur, fronterizo con Birmania. Manipur tiene menos de 2,5 millones de habitantes, pero el meitei lo hablan más de 3,3 millones de personas. Su implantación se extiende por los estados indios de Assam y Tripura, además de alcanzar zonas de Birmania y Bangladés. En Manipur se utiliza como lengua franca por 29 grupos étnicos que tienen lenguas diferentes. Fue reconocido como idioma oficial en 1992.

A diferencia de la mayoría de idiomas de la India, se trata de una lengua tonal, algo más propio de los idiomas del sureste asiático y China. En las lenguas tonales se establecen diferencias semánticas según el tono con el que se pronuncie una misma sílaba. Por ejemplo, en chino la sílaba ‘ma’ puede tener cuatro significados diferentes, según la altura del tono utilizado: caballo, insultar, madre y cáñamo. En las lenguas de la India esto es una excepción.

20. Dogri

Junto con el cachemir, el dogri también es propio del estado de Yamu y Cachemira, especialmente del distrito de Yamu. Además, cuenta con hablantes en los estados de Punyab e Himachal Pradesh. En total, lo hablan unos 2,3 millones de personas en la India y Pakistán, aunque en este último país se denomina pahari. El origen del dogri es el sánscrito de la época védica (entre 1500 y 1200 a. C.) y con los años ha registrado modificaciones en su fonología, como una mayor nasalización.

21. Bodo

El bodo es uno de los idiomas oficiales de Assam. Está catalogado como una lengua de la rama tibetano-birmana, relacionado con el dimasa, el tripura y el lalunga. Es el idioma propio de la etnia bodo, que vive en los estados indios de Assam y Megalaya, así como en zonas de Nepal. En cuanto al número de hablantes, no llega al millón y medio de personas. La inmensa mayoría se encuentran en la India, alrededor de 1,4 millones, mientras que en Nepal no llegan a los 4000 hablantes.

22. Sánscrito

La última lengua es el sánscrito. Hay una falsa creencia de que es una lengua muerta, pero en la India todavía la hablan unas 700 000 personas; si bien hay que aclarar que su uso es más bien ceremonial. Se puede comparar a la utilización del latín o del griego clásico en Europa, casi relegado a ceremonias litúrgicas. De esta manera, también en la India se usa en los ceremoniales hindúes, a través de sus mantras e himnos. En menor medida se utiliza como lengua vehicular y todavía se enseña en escuelas y en algunas familias como segunda lengua. En el estado de Karnataka hay un intento de revivir el sánscrito como primera lengua. El sánscrito es una de las lenguas clásicas de la India y una de las más antiguas entre la familia de lenguas indoeuropeas.India_37576686

Más datos de interés

Según los datos de 2017 de la edición digital de Ethnologue, en la India se han contabilizado un total de 462 lenguas individuales. De ellas, 448 siguen usándose y 14 se consideran extinguidas. De las vivas, 420 son indígenas, 64 son institucionales, 126 están en desarrollo, 190 gozan de buena salud, 55 están en problemas y 13 se están muriendo.

Para finalizar con el análisis de las lenguas oficiales, en esta tabla se muestra el número de sus hablantes:

Número             Lengua              Hablantes

1.                            Hindi                    380 millones

2.                            Bengalí                230 millones

3.                            Urdu                     104 millones

4.                            Panyabí               100 millones

5.                            Tamil                    77 millones

6.                            Télugu                  74 millones

7.                            Maratí                  74 millones

8.                            Sindi                     54,3 millones

9.                            Canarés                52 millones

10.                          Guyaratí              46 millones

11.                          Malabar               35,7 millones

12.                          Oriya                     32 millones

13.                          Maijilí                   30 millones

14.                          Asamés                20 millones

15.                          Nepalí                  17 millones

16.                          Konkaní               7,5 millones

17.                          Santalí                  6 millones

18.                          Cachemir             5 millones

19.                          Meitei                   3,3 millones

20.                         Dogri                     2,3 millones

21.                          Bodo                      1,4 millones

22.                          Sánscrito             700 000

El hindi en Internet

A pesar del importante número de hablantes y de ser uno de los idiomas más utilizados, el hindi no tiene un peso equiparable en la red. Prueba de ello es que no se encuentra entre las diez lenguas principales de Internet. Esto es un gran problema porque, aunque el inglés también es lengua nacional de la India, no todos los indios hablan inglés. Muchos hablantes de hindi no se desenvuelven en otro idioma.

En la práctica, esto significa que millones de indios usuarios de Internet casi no disponen de sitios web en su lengua. Google detectó el problema y en 2014 tomó la iniciativa de entrar en el mercado indio con el proyecto hindiweb.com, ofreciendo un portal en hindi accesible también desde dispositivos móviles. Además, lo hizo con la intención de ampliar el servicio a otras lenguas del país. Hay que recordar que en el sur de la India el hindi no es la lengua mayoritaria, ni siquiera se hablan idiomas derivados del sánscrito.

El portal de Google ofrece distintas categorías de información para que los usuarios puedan acceder a todo tipo de contenidos desde sus ordenadores, tabletas y teléfonos móviles inteligentes. Para muchos será la primera web que puedan ver en su idioma materno; lo más habitual es que los indios se conecten a sitios de lengua inglesa. El objetivo de Google es alcanzar los 500 millones de usuarios en la India, hablantes de hindi y de otras lenguas.
La diversidad necesaria

En menor medida que el hindi, a la red empiezan a asomarse otras lenguas que, incorrectamente, se suelen considerar minoritarias. No parece razonable llamar minoritario a un idioma hablado por cien o doscientos millones de personas.

Uno de los intentos que goza de una comunidad muy activa es la de la lengua oriya que, como se ha dicho, es originaria del estado de Odisha. En este caso, Wikipedia juega un papel predominante porque permite publicar contenidos a colaboradores de todo el mundo. La comunidad Wiki Oriya ha logrado colocar en la red catorce libros gratuitos escritos en su lengua, además de permitir la descarga de fuentes tipográficas oriya.

Los desarrolladores de este proyecto muestran claramente sus intenciones: “Abogamos por el uso de la lengua oriya de verdadero espíritu, en el campo de la administración diaria y del campo de la educación. Hemos tomado el proyecto para desarrollar un léxico en oriya, incluyendo versiones cotidianas de palabras técnicas para evitar la dependencia de la lengua inglesa”.

No solo el oriya se asoma a Wikipedia. Asamés, cachemir, konkaní, nepalí, guyaratí o maijilí, son algunas de las lenguas que tienen ya sus propias versiones de Wikipedia. Los indios también tienen la opción del inglés. No se puede negar que es una lengua de prestigio que se ha adaptado como koiné por muchas comunidades lingüísticas. El inglés es lengua oficial nacional y se estudia en todos los estados indios, pero su uso como lengua franca no soluciona el problema de acceder a Internet para quienes no lo dominan.

Según un estudio de las Naciones Unidas fechado en 2015, solo el 5 % de las lenguas que se hablan en el mundo tienen presencia en Internet. Este hecho es un factor negativo para la implantación de la red, porque los usuarios solo se conectarán si entienden lo que se les ofrece. Se estima que más de 4000 millones de personas aún no tienen acceso a Internet. Más de la mitad de la población mundial.

Los estudios afirman que los humanos nos comunicamos utilizando actualmente unas 7100 lenguas. Más de 2000 están en riesgo de desaparición, otras 1100 tienen serios problemas y 915 ya han entrado en el catálogo de lenguas muertas. Cada año desaparecen seis idiomas.

En total, de las 7100 lenguas registradas solo 300 tienen presencia en Internet y de todo el material disponible el 55 % está en inglés. Por el contrario, el hindi ocupa solo un 0,1 % de los contenidos, a pesar de ser una lengua que habla más del 6 % de la población mundial. Y si tomamos como referencia toda la población de la India con sus diversas lenguas, tenemos un porcentaje superior al 17 %, 1300 millones de personas que no encuentran en Internet casi ningún contenido en su idioma materno.

La pujante economía india empieza a tomar cartas en el asunto a través de sus tiendas online. Un ejemplo es Snapdeal, que ya cuenta con versiones en seis lenguas autóctonas; después de empezar con el hindi y el tamil han incorporado otros como el bengalí, el telugu o el maratí, lo que les ha permitido llegar a nuevas comunidades.

En el sector de la información también se empiezan a ver resultados. El portal hindi Bhaskar cuenta ya con más de medio millón de visitas únicas y no deja de crecer. Estas iniciativas son parte de una creciente tendencia para llegar a mercados más amplios en su propio idioma. Pero el reto sigue ahí.