En elsegundo milenio a. C. el indoario era hablado en el centro y norte delsubcontinente indio, especialmente en las cuencas delIndo y elGanges, pero también por la élite del Estado deMitanni (actualmente norte deSiria eIrak). Históricamente el subcontinente indio fue la principal región de desarrollo de ese grupo de lenguas. Sin embargo, culturalmente esas lenguas fueron influyentes en todo el sur de Asia.
Hacia elprimer milenio d. C. el sánscrito también era usado con fines particulares en elSudeste de Asia y el oeste deIndonesia, donde siguió siendo importante hasta la islamización de la región. De hecho las lenguas del sudeste asiático desarrollaron sistemas de escrituras inspirados en el sistema del sánscrito y tomaron numerosos cultismos y préstamos léxicos del sánscrito. La expansión del budismo en elAsia Central yExtremo oriente también llevó el influjo del sánscrito a esas regiones. Por ejemplo, el orden típico de loskanas japoneses está claramente inspirado en el orden del alfabetodevanagari del sánscrito.
Los primeros testimonios del indoario corresponden al sánscrito védico, la lengua usada en los textos más antiguos preservados en el subcontinente indio, que constituyen el canon fundacional delhinduismo, conocido como elRig-veda. Fuera de India también parece haber habido pueblos indoarios, como la clase dirigente delImperio mitani que floreció en el mismo período en que se compuso elRig-veda (ha existido cierto debate acerca de cómo personas de habla indoaria llegaron a Mitani).
Hacia el siglo VI a. C., el sánscrito védico fue codificado y estandarizado por el gramático indioPāṇini, y la lengua a partir de esa codificación se conoce comosánscrito clásico. El indoario medio está representado fundamentalmente por losprácritos que dieron origen a las lenguas indoarias modernas.
El indoario moderno constituye tras la rama románica la más numerosas de las ramas de las lenguas indoeuropeas. Demográficamente principal lengua indoaria actual es elindostánico (ohindi-urdu). Otras lenguas indoarias demográficamente muy importantes son elbengalí y elpanyabí. Además existe más de una docena de lenguas indoarias con más de un millón de hablantes.
Las lenguas indoarias están claramente emparentadas con laslenguas iranias deOriente Medio. De hecho comparten un buen número de innovaciones lingüísticas que evidencian que juntas forman un grupo filogenético dentro de lafamilia lingüísticaindoeuropea. De hecho el estudio detallado del sánscrito entre los siglosXVIII yXIX hizo surgir lalingüística comparativa cuya evolución dio lugar al surgimiento del estudio científico de lingüística moderna. Los registros escritos de las lenguas indoarias se extienden a lo largo de casi cuatro milenios, por lo que las lenguas pertenecientes al subgrupo indoario se clasifican en tres períodos:
Indoario antiguo (védico,sánscrito), desde los orígenes (1500 a. C.) hasta aproximadamente el 500 a. C.
La clasificación interna de las lenguas de una familia o subfamilia lingüística es un asunto más complicado que la identificación del parentesco. El primer intento científico de clasificación filogenética de las lenguas indoarias sobre la base de isoglosas compartidas se debe aHoernle (1880), quien identificó cuatro de los grupos de primer nivel aceptados hoy en día que vienen a coincidir con el grupo septentrional, occidental, oriental y meridional. Además postuló relaciones entre estos cuatro grupos, pero el trabajo posterior no las ha confirmado.Grierson (1907, 1931)[1] propuso modificaciones y aceptó en gran medida el trabajo de Hoernle, una contribución de este autor es reconocer a laslenguas dárdicas como grupo filogenético independiente. Otras clasificaciones posteriores propusieron árboles filogenéticos diferentes, aunque en general coincidían en los grupos de primer nivel: Chatterji (1926), Turner (1966, 1975), Katre (1968), Nigam (1972) y Carmona (1974).
Prescindiendo de las relaciones en árbol filogenético que siguen siendo un problema discutido los grupos filogenéticos de primer nivel casi universalmente aceptados son el grupo dárdico, el grupo noroccidental, el grupo pahari, el grupo central, el grupo oriental o maghadi, el grupo meridional y el grupo insular (aunque diversos autores usan nombres ligeramente diferentes para estos grupos y difieren en la adscripción de algunas pocas lenguas a estos grupos). Las relaciones precisas entre esos grupos no está clara pero varios autores proponen clasificaciones similares a la siguiente:
Indoario septentrional formado por:
Laslenguas dárdicas, que para la mayoría de autores junto con las lenguas noroccidentales forman una unidad filogenética válida, las lenguas más importantes de este grupo es elcachemiro, elshina y elkhowar.
Las lenguas indoarias retienen un buen número de arcaísmos delprotoindoeuropeo, como el género gramatical, el caso, la voz pasiva sintética, etc. Aunque algunas de las lenguas han perdido gran cantidad de rasgos del indoeuropeo más antiguos, y algunas han desarrollados rasgos aparentemente ajenos al indoeuropeo tardío como son la aparición deconstrucciones ergativas e incluso el desarrollo detonos.
El sistema fonológico tiene la pecularidad de distinguir entre cuatro tipos de oclusivas: sordas simples, sonoras simples, sordas aspiradas y sonoras aspiradas. Además tienenconsonantes retroflejas o cacuminales. Usualmente las retroflejas se transcriben como < ṭ, ḍ, ṭh, ḍh, ṇ, ṣ > (el punto en las transcripciones < ṛ, ḷ > se refiere generalmente a que son líquidas silábicas, no necesariamente retroflejas).
Otro rasgo destacado es la existencia de oposición entre oclusivasaspiradas y no aspiradas. Incluso la aparición en muchas lenguas indoarias de "aspiradas sonoras".