L'écriture arabe courante ne note pas les voyelles, qui peuvent cependant apparaître sous forme dediacritiques dans certains textes à caractère didactique (Coran, apprentissage de la lecture, dictionnaires). De ce fait, un mot écrit en arabe peut généralement admettre plusieurs lectures suivant la répartition (ou l'absence) de voyelles et de redoublement de consonne, et s'apparente souvent à unesténographie : il faut pouvoir lire correctement un texte pour le comprendre, et il faut comprendre un texte pour le lire correctement ; seule une bonne connaissance de la langue permet de déterminer le bon mot en fonction du contexte. Cette caractéristique de l'écriture arabe découle de la structure consonantique deslangues sémitiques, où les consonnes sont généralement porteuses de la sémantique, les voyelles ne dépendant que de la nature lexicale du mot et de sa fonction grammaticale. De ce fait, l'écriture arabe note plus particulièrement la sémantique d'ensemble, à la manière d'unidéogramme, laissant en grande partie au lecteur le soin de traduire la lecture en langage courant.
Avec l'expansion de l'islam, différentes langues ont adopté le système d'écriture de l'arabe, langue duCoran, et l'usage de l'alphabet arabe s'est progressivement répandu. C'est ainsi que cet alphabet sert également à écrire certaineslangues indo-européennes comme lepersan, lekashmiri, lesindhi, l'ourdou, lekurde. Il est aussi utilisé enChine, dans les provinces duXinjiang, duGansu et duNíngxià ainsi que chez certaines minorités qui ont embrassé l'islam (on parle dans ce dernier cas dexiao'erjing). L’arabe a enfin servi à noter certaines langues d'Afrique (swahili,haoussa,wolof,somali), ainsi que leturc jusqu'en1928.
Sur le plan linguistique, l'arabe se rapproche plus des langues notées par l'alphabet sudarabique, dont notamment la liste de consonnes est beaucoup plus complète[3]. Bien que l'arabe appartienne à l'aire linguistique sud-arabique, les tribus nomades d'Arabie centrale ont adopté pour sa notation l'alphabet utilisé au nord de cette région, dans lecroissant fertile, qui était culturellement et économiquement dominant à l'époque. De manière significative, la première écriture arabe attestée a été lekufi, écriture du centre culturel deKoufa situé sur les rives de l'Euphrate.
Ce tableau permet de voir les évolutions du tracé des lettres depuis le prototype phénicien de l’araméen : les graphèmes du système arabe y sont présentés, à simple titre de comparaison, entre les lettres du nabatéen et celles du syriaque. L’ordre alphabétique a évidemment évolué.
Les voyelles ayant plus d’incidence sur la syntaxe de l’arabe que sur celle du nabatéen[3], on a très vite senti la nécessité de les indiquer. À cette fin, l'arabe utilisa les trois lettresalif,ya etwaw pour indiquer respectivement les voyelles longuesâ,î etû. Par la suite, lealif perdit complètement son rôle de consonne, et lahamza fut introduite comme signe diacritique pour indiquer l'emplacement de cette articulation. De ce fait, l'alphabet arabe n'est qu'imparfaitement unalphabet consonantique :
les lettresya etwaw ont conservé leur rôle de semi-consonne, mais peuvent également servir de signe de prolongation des voyelles homologues, ou de support à lahamza ;
la lettrealif n'est qu'un signe de prolongation ou de support dehamza, mais n'a pas de valeur propre ;
leya peut également servir de signe de prolongation dua en fin de mot, où il prend la formeى (alors dénommé ʾalif maqṣūra) ;
et inversement, lahamza n'a pas de place officielle dans cet alphabet bien qu'étant dans la langue une consonne à part entière.
Le modèle araméen ayant moins de phonèmes que l'arabe, l'écriture des origines avait dû confondre pour une même lettre plusieursphonèmes de la langue arabe. Ce problème est toujours manifeste de nos jours, dans l'écriturekufi que l'on retrouve dans des inscriptions monumentales et certaines œuvres calligraphiques.
Initialement, l'écriture n'était pas munie des points appelés «diacritiques» dont sont maintenant marquées certaines consonnes de l'alphabet arabe pour distinguer et fixer la valeur exacte des signes consonantiques qui prêtaient à confusion. De plus, les voyelles brèves n'étaient pas écrites, et les longues, pas toujours. Il s'ensuivait que l'écriture était figurée par un simple support consonantique que, le plus souvent, l'on ne pouvait lire que si l'on connaissait déjà le texte[4].
C'est auVIIe siècle qu'on a ajouté despoints sur ou sous certaines lettres afin de les différencier. Lors de ces modifications, l'ordre des lettres a été modifié : l'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques mais regroupe les lettres en fonction de leur forme graphique. Pour les deux lettresq etf, l'usage a été long à s'établir. Au début, durant les deux premiers siècles de l'hégire, leq portait un point au-dessus, et lef n'en avait point. Puis lef reçut un point au-dessous, comme ce fut longtemps le cas dans l'alphabet maghrébin. En fin de compte, le point duf passa au-dessus, et leq en reçut deux, conformément à l'usage courant[3].
L'alphabet arabe comprend vingt-huitlettres (vingt-neuf si l'on inclut lahamza[5], qui se comporte soit comme une lettre à part entière soit comme undiacritique). Il se lit et s'écrit de droite à gauche, comme beaucoup d'écritures sémitiques utilisant desabjads (syriaque, hébreu, etc.).
Pour les nombres, l’arabe note le chiffre des unités avant la dizaine : la forme résultante est donc la même que dans les langues latines.
De nombreuses lettres sont similaires par leur squelette (rasm) et ne se distinguent que par des points utilisés commediacritiques au-dessus ou au-dessous de la ligne d'écriture (ـثـ ـتـ ـنـ ـبـ ـيـ). Il existe 18 formes de base (rasm). Lesadaptations de l'alphabet arabe à d'autres langues se font sur ces mêmes formes de base, le plus souvent par l'ajout de points.
Il n'y a pas de différence entre les lettres manuscrites et les lettres imprimées, et les notions de lettremajuscule et lettreminuscule n'existent pas : l'écriture est doncmonocamérale.
En revanche, la plupart des lettres s'attachent entre elles, même en imprimerie, et leur graphie peut changer selon qu'elles sont en position initiale (liées à la lettre suivante mais pas la précédente), médiane (liées des deux côtés), finale (liées à la précédente mais pas la suivante) ou qu'elles sont isolées (sans liaison) : on parle devariantes contextuelles. La liaison peut être plus ou moins allongée sans changer la lecture des lettres :كتب (ktb), normalement compacté, peut également être renduكـــتـــب en allongeant les liaisons (Kashida), par exemple pour créer un effet calligraphique, ou pour des raisons de justification de mise en page.
Par ailleurs, six lettres (و ز ر ذ د ا) ne s'attachent jamais à la lettre suivante, de sorte qu'un mot peut être entrecoupé d'un ou plusieursespaces. Ces séparations entre lettres ne s'attachant pas à l'intérieur des mots sont moins grandes que celles séparant les mots. Par exemple,Paris s'écritباريس (Bārīs), où ni le a long ni le r ne se lient à la lettre suivante (s'il fallait allonger la graphie par des liaisons,باريس peut s'écrireبــــاريــــس, mais les intervalles entre a et r ou entre r et i, qui sont des séparations, ne peuvent pas être allongés).
L'alphabet arabe étant un alphabet consonantique, le lecteur doit connaître la structure de la langue pour restituer lesvoyelles.Dans le cas de l'arabe, les voyelles d'un mot se répartissent au sein de laracine consonantique, suivant les règles de grammaire.
Dans les éditions duCoran ou les ouvrages didactiques, cependant, on utilise une notation vocalique plus ou moins précise sous forme de diacritiques. Il existe, de plus, dans de tels textes dits « vocalisés », une série d'autres diacritiques de syllabation dont les plus courants sont l'indication de l'absence de voyelle(sukūn) et lagémination[6] des consonnes(šadda).
La forme des lettres est variable suivant qu'elles sont isolées, ou en position initiale, médiane ou finale. Ces différentes formes sont données dans le tableau ci-dessous.
La notion de « initiale » ou « finale » ne se réfère cependant pas uniquement aux séparations entre mots de la langue. Dans un même mot, certaines lettres ne se lient jamais avec les suivantes, et sont donc normalement en forme « finale » ; et la suivante est alors en forme « initiale », y compris à l'intérieur d'un mot.
La plupart des lettres n'ont fondamentalement que deux formes, qui sont généralement « isolées + finales » et « initiales + médianes ». Les lettres qui impliquent quatre formes distinctes sont limitées, à savoir le ع (ʿayn) et le غ (ġayn), ainsi que le ه (hāʾ).
Dans le tableau ci-dessous, les lignes limitées à deux formes dans la colonne « finale, médiane, initiale » sont celles qui ne se lient pas à la suivante, limitant l'alternative à « initiale, ou médiane / finale ».
† : Dans les dictionnaires, la première place est celle duhamza. Il apparaît sous forme dealif parce que son support est dans ce cas unalif.
* : Cas particulier : la suite « Lâm - Alif » forme une ligature spécifique :لا ouﻻ (voir également ci-dessous).
‡ : Lealif n'est pas à proprement parler une lettre, mais joue le rôle de signe de prolongation ou de support dehamza. De ce fait, il n'a pas de prononciation propre. La prononciation donnée ici est celle de lettre de prolongation.
L'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques, mais regroupe les lettres en fonction de leur forme graphique, et pour une même forme de base, suivant le nombre ou la position des points. L'ordre levantin traditionnel ne se reflète plus que dans la valeur numérique des lettres, donnée ci-après.
L'ordre à présent classique est l'ordre traditionnel oriental, celui donné dans le tableau ci-dessus :
Il faut noter que bien qu'en tête de l'alphabet, lealif n'est pas à proprement parler une lettre à part entière, mais joue le rôle de signe de prolongation ou de support dehamza. Dans les dictionnaires, la première place est celle duhamza.
LeMaghreb a longtemps suivi un ordre différent. En outre, dans l'alphabet arabe dit « occidental », la lettrefāʾ était écriteڢ (au lieu deف de l'alphabet oriental), tandis queqāf était représentée parڧ (plutôt queق) et le tracé des lettres était de plus sensiblement différent :
De nos jours, les éditions maghrébines suivent les usages orientaux. Il faut noter pourtant qu'il existe toujours des publications du Coran en style andalou et maghrébin (occidental).
L'ordre actuel de l'alphabet arabe ne concorde pas avec celui des autres écritures sémitiques. Celui-ci est cependant encore connu et désigné sous le nom d'abjad. On l'utilisait dans la numération au moyen de lettres au lieu de chiffres, notamment dans la pagination d'une préface. Dans sa séquence orientale, l'ordre coïncide avec celui de la valeur numérique de chaque lettre[7].L'ordre Abjad n'est pas une simple continuation historique de l'ordre alphabétique sémitique du nord, car il a une position correspondant à la lettre araméennesamekh / semkat ס, dans la mesure où aucune lettre de l'alphabet arabe ne dérive historiquement de cette lettre. La perte desamekh a été compensée par la scission deshin ש en deux lettres arabes indépendantes, ش (shīn) et ﺱ (sīn), cette dernière ayant pris la place desamekh.
Ces rôles viennent en plus du rôle de semi-voyelle tenu par lewaw et leya.
Alors que dans le principe toutes les lettres de l'alphabet arabe sont des consonnes et chaque consonne est représentée par une lettre, ce n'est pas le cas pour lealif et lahamza :
Lealif n'est pas une consonne mais un signe orthographique, dérivé de la lettre représentant lahamza dans les alphabets d'origine phénicienne.
Inversement, lahamza, bien que consonne à part entière, n'a pas de lettre propre et s'écrit (le cas échéant) avec undiacritique.
Quand elle est une lettre radicale, pour représenter une racine dans un dictionnaire, lahamza est toujours représentée par un supportalif, et se trouve au début de l'ordre lexicographique ; c'est ce que l'on appelle unalif-hamza. C'est pour cette raison que lahamza est présentée en début d'alphabet dans le tableau ci-dessus, bien que ne faisant techniquement pas partie de la liste des lettres. Cependant, sa lettre de support peut varier suivant le schème appliqué à cette racine, ce qui peut conduire à la confondre avec unwaw ou unya.
Lorsque lahamza est en début de mot, sa lettre de support est toujours unalif, indépendamment de la voyelle effectivement portée. C'est pourquoi l’alif, pour les personnes qui n'ont pas étudié les principes, semble avoir toutes sortes de prononciations, alors qu'en réalité il n'est pas même une lettre, mais un simple support, ou bien le signe d'une contraction en A, ou de la prolongation d'un A bref[8].
Historiquement, leةtāʾ marbūṭa (« tāʾ bouclé ou lié») est un dérivé duتtāʾ et non duهhāʾ, d'où la présence des deux points suscrits. Il suffit de boucler untāʾ pour obtenir untāʾ marbūṭa. Il s'agit d'une consonne, à savoir un /t/ ; toutefois, elle ne se trouve qu'en fin de mot et elle est toujours précédée de la voyelle brève /a/ (qui n'est que rarement écrite). Le son /t/ n'est prononcé que si elle est précédée d'un alif (ا) ou si les voyelles casuelles finales qui suivent le ta le sont aussi, ou encore dans le cas d'une annexion (iḑāfa); or, ces voyelles sont souvent omises dans la prononciation courante. C'est pour cette raison qu'on indique, improprement, que cette lettre vaut [a(t)].
Letāʾ marbūṭa a une valeur grammaticale en arabe : c'est souvent la désinence du féminin (pour les adjectifs, les substantifs, ainsi que pour la forme féminine des noms propres qui existent au masculin—par exemple: Samīr / Samīra). Cette lettre peut toutefois terminer des substantifs se référant à des entités clairement masculines, tels quecalife (خليفة) oucommandant (dans ce cas, pour la forme plurielle :قائد ج قادة). Désinence finale de substantifs ou d'adjectifs, letāʾ marbūṭa ne se retrouve donc jamais dans la conjugaison proprement dite des verbes arabes.
Untāʾ marbūṭa se transforme en « tāʾ ṭāwila » (« long », donc « normal ») lorsque le nom est mis à la formeduelle ou lorsque le mot est suivi d'unmorphème, tel que celui de la possession :طاولة - طاولتي (« ma table » ~ « table »)
Dans une prononciation soutenue, on fait entendre à la pause un [h] à la place du [t]. Letāʾ marbūṭa est rarement transcrit quand il est muet ; seule la translittération en indique généralement la présence (voir plus bas à la section « Translittération »), mais les usages sont très fluctuants. Dans cette encyclopédie, letāʾ marbūṭa sera noté parʰ. Voir aussi plus bas à « Types de lecture » pour d'autres détails.
La lettreىʾalif maqṣūra ne s'utilise qu'en fin de mot ; comme l'alif standard, c'est une lettre de prolongement pour le phonème /a/. Son nom indique le son obtenu, « ʾalif de prolongement », et non sa forme, puisque la lettre ressemble à unيyāʾ. Son utilisation est décrite à lasection « Voyelles longues et lettres de prolongement ».
Comme ligature linguistique, l’arabe ne connaît que la ligature lâm-alif. Lorsqu'unل (lām) est suivi d'unا (ʾalif), il faut remplacer l'ensemble des deux lettres par laligatureلا.
LeAlif maddah se présente ainsi : آ. Il correspond à situation où il faut écrire un « â » long, donc normalement unfatha suivi de la lettreʾalif de prolongation, accompagné d'unehamza dont le support devrait être un autreʾalif. Cependant, l'on ne peut écrire deux fois de suite la lettreʾalif. Dès lors, la parade a été l'ajout d'une sorte de tilde au-dessus de la lettreʾalif, pour signaler qu'il a la valeur de double lettre (ʾalif).
LeAlif maddah signale donc à la fois la voyelle longue (a) et unehamza.On retrouve cette lettre spécifique notamment dans le mot « coran » :قُرْآن (qurʾān).
Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas dediacritiques, à part les points souscrits ou suscrits, nécessaires pour distinguer deslettres ambiguës, parce que présentant unductus identique, comme on peut le voir, par exemple, dans ces trois ensembles :ب ت ث / ج ح خ / د ذ
Cependant, plusieurs signes auxiliaires permettent de faciliter la lecture et lever la plupart des ambiguïtés du texte, en particulier dans un cadre didactique ou religieux. Car si le texte est ambigu, c'est que, en principe, l'arabe ne note ni les voyelles, ni lesgéminations ni lesassimilations, si bien qu'il faut avoir une bonne connaissance de la langue pour lire correctement un texte, tant en lecture silencieuse qu'à voix haute. La lecture est donc particulièrement difficile pour les personnes qui apprennent à lire, qu'elles soient arabophones ou qu'elles étudient l'arabe. C'est pourquoi, les méthodes de lecture pour les enfants ou les manuels d'apprentissage de l'arabe ajoutent en général ces signes. Il en va de même pour le Coran et les textes comme leshadith, dans ce cas afin de lever toute ambiguïté de lecture, et de prévenir ainsi de possibles lectures « déviantes ».
Celles-ci ne sont pas indiquées autrement que par desdiacritiques, et elles le sont seulement (et rarement) pour lever des ambiguïtés ou, de façon quasi systématique cette fois, dans les ouvrages didactiques ou religieux. Quand un texte présente toutes les voyelles, on dit qu'il est vocalisé. L'absence de la notation des voyelles brèves rend parfois ambiguë la compréhension des mots, en particulier lorsque ceux-ci sont lus isolés de tout contexte.
Le mot « al-'arabiyya » (l'arabe), avec les points diacritiques sous ou sur les consonnes, mais sans notation des voyelles brèves.
Parlant des motsخلف (KH-L-F) etملك (M-L-K) — que l'on rencontre ainsi dans un texte, sans voyelle,Vincent Monteil écrit que« seul le contexte permet de choisir, par exemple, entre les lectureskhilf(tétine),khulf(différence, intervalle) etkhalaf(équivalent); ou bien entremulk(pouvoir, autorité),milk(droit de propriété)malik(roi) etmalak(ange), etc.[9] ». Sans voyelle, la série des trois premiers mots s'écrit à chaque foisخلف, et la secondeملك. C'est un peu comme si l'on devait lire la suite de consonne PRS : on peut avoirpars, pères, paris, purs, pairs, etc. Seul le contexte permettrait de lire : « les PRS(pères) sont à PRS(Paris), la capitale de la France » ou « je PRS(pars) au bord de la mer écouter les sons PRS(purs) des vents marins ». Et Monteil de citer[9] ce jugement sévère de l'arabisant Jean Lecerf :« Cette écriture [l'arabe] est une plaie pour la lecture, pour l'enseignement et pour tout usage pratique de la langue. »
Un autre mot de trois consonnes,كتب (ktb), peut théoriquement se lire, selon le contexte, de dix-huit manières différentes, parmi lesquelles :
un nom masculin plurielكُتُب (kutub, livres), pouvant prendre six désinences casuelles différentes (nominatif/accusatif/génitif définis, nominatif/accusatif/génitif indéfinis)
un nom d'action singulierكَتْب (katb, le fait d'écrire), pouvant prendre les six mêmes désinences casuelles
un syntagme préposition + nomكَتَبِّ (ka-tabb, comme un tranchement).
Tous ces mots sont discriminés par des voyelles brèves qui la plupart de temps ne sont pas écrites. Il en résulte qu'ils se trouveront tous sous l’orthographe uniqueكتب (ktb) dans la plupart des textes. C'est donc au lecteur de rajouter mentalement les voyelles nécessaires afin de déterminer le sens véritable du mot en question. Il sera pour cela grandement aidé par le contexte. Mais cela signifie aussi qu'on ne peut vraiment lire (au sens d'articuler le texte en prononçant intérieurement ou à haute voix tous les sons) un texte en arabe que si on le comprend.
L'alphabet arabe, bien qu'il soit unabjad, marque systématiquement l'emplacement de voyelles longues. Quatre lettres, dites « de prolongement », sont employées pour indiquer la présence d'une voyelle longue — qui, elle, n'est normalement pas écrite —,اʾalif,ىʾalif maqṣūra (seulement en fin de mot),يyāʾ, etوwāw. Ces deux dernières sont aussi les semi-consonnesy etw. Il faut remarquer que ces lettres peuvent également servir de support dehamza, donc reflètent une voyelle associée, et sont susceptibles de marquer unediérèse quand elles sont entourées de deux voyelles (voirécriture de la hamza).
Partant, ces signes indiquant les emplacements en question sont alors lus comme s'ils figuraient des voyelles. De sorte, ces lettres, qui sont toutes des consonnes (historiquement pourاʾalif), peuvent, d'une certaine manière, remplir le rôle de voyelles longues. On dit alors qu'elles sont desmatres lectionis (enlatin « mère de la lecture »). D'autres écritures sémitiques, du reste, comme l'alphabet hébreu, retiennent ce procédé. Ceci qui mène certains spécialistes des écritures (comme Thomas Bauer ;cf. bibliographie ci-dessous) à considérer que cesabjads ne sont pas purement consonantiques et qu'ils méritent bien l'appellation d'alphabets, dotés de voyelles.
Dans un texte non vocalisé, ce qui est de loin le cas le plus fréquent, l'on obtient les ambivalences suivantes :
اʾalif =ā long, ou support de la consonneʾ (coup de glotte) suivie dea ou d'autres phonèmes ;
ىʾalif maqṣūra =ā en fin de mot ;
يyāʾ =ī, ouy, ou support de la consonneʾ (coup de glotte) ;
وwāw =ū, ouw, ou support de la consonneʾ (coup de glotte).
En fait, qualifier la semi-consonne de « voyelle » dans ce cas est arbitraire : la structure syllabique de la langue veut au contraire qu'elle soit considérée comme une consonne. La prosodie arabe connaît en effet deux types de syllabes :
Les syllabes « courtes », ouvertes (de type consonne + voyelle), que l'arabe écrit par une seule lettre, et dont la voyelle est toujours courte ;
Les syllabes « longues », en principe fermée (de type consonne + voyelle + consonne), que l'arabe écrit (généralement) par deux lettres, mais dont un cas particulier est la syllabe longue fermée par la semi-consonne homologue (voyelle longue).
Par rapport à cette structure, il est incohérent de dire que les semi-consonnesy etw représentent dans ce dernier cas des voyelles, ou qu'une séquence commeبَيْ doit se lire comme unediphtonguebaï plutôt que comme une voyelle ferméebay. En réalité il n'y a pas desolution de continuité entre lei et ley, ou entre leu et lew. L'arabe décompose logiquement le phonème long en une voyelle suivie de la semi-consonne homologue, par exemple,uw pour le sonū ; comme seule la semi-consonne est écrite, celle-ci semble noter aussiū.
Dans cette logique, qui veut qu'une syllabe à voyelle longue soit fermée par la consonne homologue, il n'y a pas de semi-consonne qui soit homologue aua. La fermeture de la syllabe est alors matérialisée par un’alif, qui représente dans ce cas la trace d'unehamza marquant l'arrêt de la vocalisation — de même que pour l'arabe, une syllabe commençant par une voyelle est « en réalité » ouverte par unehamza, supportée par unalif qui par lui-même est muet, ou que la fin de certains mots se terminant par unwaw est marquée par unalif muet.
Dans les dictionnaires arabes, les mots sont généralement classés parracine: tous les mots dérivés d'une même racine se retrouvent donc dans une même entrée, déterminée par les consonnes de la racine (v. ci-dessous). Trouver un mot dans le dictionnaire nécessite donc de trouver sa racine, derrière le mot dans lequel elle est coulée. Soit, par exemple, le motmaktûb : pour le trouver dans le dictionnaire, il faut comprendre qu'il s'agit d'un dérivé de la racine K-T-B, afin de le chercher sous cette entrée, ce qui nécessite de distinguer les lettres radicales des lettres serviles ou formatives (v.infra). Et comme, à l'exception de certains termes grammaticaux, tous les mots arabes dérivent d'une racine, il faut donc apprendre à retrouver celle-ci derrière un mot donné. Pour cela, on s'appuie sur deux éléments: la racine et leschème (outhème)
Dans leur immense majorité, les mots du vocabulaire arabe dérivent donc de racines. Celle-ci est une unité abstraite minimale composée exclusivement de deux, trois ou quatre (parfois cinq) consonnes. Une racine« représente une notion défininie: K T B, notion d'écrire »[10]. La très grande majorité des racines sont trilitères, c'est-à-dire composée de trois consonnes. Dans un dictionnaire d'arabe standard moderne qui recense d'environ 50 000 mots, on compte quelque 6 500 racines[11]. Dans les langues sémitiques comme l'arabe, l'information sémantique essentielle est donc portée par les consonnes, qui constituent la racine. Mais en tant que suite composée uniquement de consonnes, une racine est imprononçable[11]. Elle doit donc être coulée dans un schème (outhème)[11], que l'on peut définir« l'ensemble des consonnes et des voyelles qui composent un mot »[10].
Tout substantif, nom propre, adjectif, verbe, nom verbal, (maṣdar), participe, ou adverbe effectivement utilisé dans la langue, est porté par un schème (ou thème). Un schème est« l'ensemble des consonnes et des voyelles qui compose un mot:kataba"il a écrit", et que complètent les flexions nominales ou verbales.[10] » Au fond un mot arabe est le résultat du croisement d'une racine (qui détermine donc un sens, une notion) et d'un schème (qui détermine une fonction grammaticale, des liens de dérivation sémantiques, et permet de créer un mot).
On compte environ une soixantaine de schèmes verbaux et plusieurs centaines de schèmes nominaux. Toutefois, les plus utilisés sont en nombre relativement restreint[12]. Les schèmes permettent donc de construire, à partir des racines, les mots effectivement utilisés dans le discours. Ils habillent le radical au moyen de préfixes, de transformationsinfixes (ajout de consonnes, doublement de consonne, ou transformation de voyelles) et desuffixes.
Les voyelles ne dépendent que du schème, et ne portent qu'une information secondaire sur la fonction lexicale ou grammaticale du mot. Lesvoyelles ne sont que rarement notées, et si elles le sont, c'est sous la forme dediacritiques : toutes les lettres des tableaux précédents sont desconsonnes, contrairement à ce qu'on pourrait croire. De ce fait, la recherche d'un mot (dans un dictionnaire ou un texte) se fait normalement abstraction faite des voyelles et autres diacritiques.
Ces éléments expliquent que la plupart des dictionnaires arabes classent tout d'abord les racines, puis à l'intérieur de chacune de celles-ci, les différents mots produits par la racine, suivant un ordre propre aux schèmes. Dans la langue, les mots (nom, verbe, adjectifs) ainsi obtenus sont ensuite déclinés suivant leur fonction grammaticale, suivant un mécanisme similaire de transformation préfixe et suffixe. D’une certaine manière, la racine arabe subit une double modification : l’application d’un schème lexical, donnant l'entrée lexicale théorique, puis celle d’un schème grammatical, donnant la forme effectivement produite dans le discours.Inversement, pour trouver un mot inconnu dans undictionnaire, il faut donc tout d'abord faire abstraction des déclinaisons et conjugaisons (ainsi que des préfixes et suffixes éventuels) pour identifier lelexème ; puis identifier et faire abstraction du schème pour trouver la racine de classement.
Si l'on considère que C1 C2 C3 (pour Consonne1, etc.) sont les trois consonnes d'une racine quelconque, on peut former exemple (l'astérisque, *, remplace une consonne) :
la racine KTB (« écrire ») croisée avec le schème "C1ÂC2aC3a" (schème qui marque une « action réciproque ») donne KÂTaBaكاتَبَ, « s’échanger une correspondance » ;
la même racine KTB (« écrire ») croisée avec un schème "maC1C2ûC3 (participe passif, « ce qui est dans cet état ») donne MaKTûBمَكتوب, « ce qui est écrit », ⇒ « le destin » ;
une autre racine F3L (« réaliser, agir ») croisée avec ce même schème "maC1C2ûC3 donne MaF3ULمَفعول, « ce qui est agi » = « patient, passif ».
La construction de familles de mots n'est pas inconnue en français, comme dans la série « lard, larder (action), lardoir (outil ou lieu), lardeur (agent), etc. » ; mais le procédé est systématique et relativement régulier dans les langues sémitiques.
Par rapport à leur emploi, les lettres sont ou « radicales » ou « serviles ». Les lettres serviles, ainsi nommées parce qu’elles servent à former les inflexions grammaticales et les dérivés, sont comprises dans les deux mots techniquesيَتَسَمُّوا بِفُلْكٍ (qu'ils s'engraissent dans un navire). Toutes les autres lettres s‘appellent radicales, c’est-à-dire qu‘elles ne servent qu'à former des mots radicaux[13]. Cependant, les consonnes qui peuvent s'ajouter à une racine sont : hamza, tâ', sîn, mîm, nûn, wâw, yâ', à quoi s'ajoutent la voyelle longue 'alif. On les réunit dans l'expression mnémotechnique'anta mûsâ (أنت موسى, « tu es Moïse », la lettre finale, alif maqsûra, pouvant jouer le rôle de yâ').
il y a six lettres réellement serviles :alif ethamza (ا أَ إ),tâ (ت ـَة),mînم,nûnن,wâwو etyâي ;
les grammairiens joignent à ces lettres, réellement formatives, d'autres lettres qui ne sont que des prépositions et conjonctions préfixes ou des pronoms affixes, ce sont :tâت,kâfك,lâmل,fâف etsînس. Ces particules se joignent effectivement au mot, sans avoir d'influence sur forme caractéristique, tout comme il en va, en français pour le « l' » dans « l'opinion » ou le « d' » dans « place d'arme », etc[14].
D'autre part, les « lettres faibles (semi-consonnes) » que sont lewaw et leya peuvent subir diverses transformations. À cela vient s'ajouter la lettre 'alif, qui est toujours la voyelle longue /â/[15] et ne fait jamais partie d'une racine. En revanche, il se peut qu'il « cache » la semi-consonne d'une racine. Pour rechercher une racine dans un dictionnaire, il faut savoir que :
quand elle est une lettre radicale, lahamza est toujours représentée par un supportalif, et se trouve au début de l'ordre lexicographique. En revanche, dans un mot donné, elle peut prendre comme support l'une des trois lettres faibles, voire être écrite en ligne. Elle figure toujours dans l'écriture, mais toujours par une lettre servile ;
quand ils sont lettres radicales, lewaw et leya conservent leur ordre lexicographique en avant-dernière et dernière place. Mais dans l'écriture d'un mot donné, ils sont parfois transformés en unalif, voire peuvent disparaître complètement (racines assimilées, creuses, ou défectives).
Face à un mot inconnu, une lettre radicale fait certainement partie de la racine ; en revanche une lettre servile peut correspondre à une lettre ajoutée au radical par un schème, ou être une lettre radicale. Inversement, la racine peut être faible (racines assimilées, creuses, ou défectives), et une lettre faible peut devoir être rajoutée comme radicale entre deux consonnes déjà identifiées comme radicales.
L'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques mais regroupe les lettres en fonction de leur forme graphique. L'intérêt de cet ordonnancement tient à la valeur numérique attribuée à chaque lettre en fonction de sa place dans l'alphabet.
Sur les objets liés aux pratiques mystiques ou scientifiques (astrolabes,globes célestes), ou encore dans lescolophons des manuscrits, les chiffres sont parfois donnés sous forme de lettres : on parle de numérotation en abjad.
Les lettres numériques arabes ne sont plus guère employées que par des savants qui s'occupent à faire des chronogrammes dont les lettres, additionnées ensemble, donnent la date de l'année dans laquelle s'est accompli tel ou tel événement[16].
Elles restent employées pour numéroter les items dans des listes, que ce soit dans des documents ou dans des présentations.
Il existe d'autres ligatures de ce type, de deux ou trois lettres, voire plus, qui ne sont cependant plus utilisées, sauf dans des compositions soignées et quelques cas figés. On peut encore les rencontrer dans des textes anciens.
On les trouve dans le blocUnicode dans lesFormes A de présentation arabes à partir de U+FBEA, mais ces caractères ne sont pas toujours supportés. Certaines sont représentées dans l'article consacré aux ligatures.
Historiquement, la lettreʾalif notait une occlusive glottale, ou « coup de glotte », transcrite par [ʔ], ce que confirment les alphabets issus de la même origine phénicienne. Or, elle a servi, de la même manière que dans d'autresabjads, avecyāʾ etwāw, demater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue. De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis,ʾalif sert principalement à remplacer des phonèmes, noter l'allongement de la voyelle /a/ ou servir de support graphique à certains signes.
L'alphabet arabe se sert maintenant de la lettrehamza pour transcrire le coup de glotte, phonème qui, en arabe, peut se manifester n'importe où dans un mot, même à l'initiale ou en finale. Cette lettre, cependant, ne fonctionne pas comme les autres : elle peut être écrite seule ou avoir besoin d'un support, auquel cas elle devient un diacritique :
sans support :ء ;
avec support :إ,أ (sur et sous unʾalif),ؤ (sur unwāw),ئ (sur unyāʾsans points ouyāʾ hamza).
Dans quelques mots, et surtout au cours de laflexion verbale, on peut écrire unʾalif qui ne se prononce pas et ne sert pas de support à un diacritique. On le trouve principalement dans le motمِائَة (miʾa signifiant « cent »), qui serait écrit plus régulièrementمِئَة).
Dans la conjugaison, on ajoute également unʾalif muet après unwāwو en fin de mot ; ainsi :
L'alphabet arabe ne note pas les cas d'assimilations des consonnes en contact :
dévoisement : malgré ce que la graphie indique,مُبْتَدَأmubtadaʾ est prononcé /muptadaʾ/. Il est notable que l'écriture ne se modifie pas dans ce cas pour suivre la prononciation, au contraire de ce qu'elle fait dans d'autres cas (élision de lahamza instable, par exemple) ;
assimilation complète de l'articleأَلʾal : le /l/ de l'article est entièrement assimilé aux 14 consonnes dentales, liquides et spirantes (à l'exception de la spirante jîm) qui suivent (traditionnellement nommées consonnes « solaires » parce que deux d'entre elles (sîn etšîn) entrent dans le mot « soleil »(šams,شَمْس), par opposition aux 15 autres consonnes dites « lunaires » parce que le mot « lune »(qamar,قَمَر) commence par l'une d'entre elles, appeléeqâf[17]. L'écriture, cependant, ne note pas clairement cette assimilation°: /ʔal/+/d/ > /ʔadd/, notéد + أَل(ʾal + d-)>أَلدّ (translittération :ʾaldd- ; noter lašadda) et non *أَدّ (translittération :ʾadd). La lettrelām, en effet, continue d'être écrite bien qu'elle ne soit plus prononcée (elle ne reçoit donc pas desukūn) ; la graphie est d'autant plus redondante que la gémination obtenue peut être – rarement – indiquée par lašadda. La transcription doit cependant donner la prononciation, dans le cas précédent :ʾad-d (on place un trait d'union entre l'article et le nom pour indiquer que dans la graphie arabe, l'article est directement collé au nom ; c'est aussi le cas pour d'autres mots outils).
Au-delà des normes scientifiques d'autres modèles de translittération accessibles à tous sont utilisés par les auteurs ou les maisons d'édition musulmanes. Parmi ces modèles :
La translittération de chaque lettre arabe par une et une seule lettre latine et non pas deux comme c’est souvent le cas pour la translittération de la lettre «« ث » ou « خ » ou les lettres similaires (voir tableau ci-dessous).
Lettre arabe
ث
ذ
خ
ش
ظ
غ
Translittération employant deux lettres
th
dh
kh
sh ou ch
dh
gh
Nouvelle translittération
t
d
ḳ
ṡ
ẓ
ṙ
La translittération du son « ou » représenté en arabe par la voyelle « ḍammah » est représenté par une seule lettre latine le « u ».
La translittération des lettres arabes emphatiques, auxquelles il faut rajouter la lettre « ح » par un point sous les lettres latines qui les représentent à l’exception du « غ » pour qui le point a été placé au-dessus de la lettre « r » qui la représente
Lettre arabe
ح
خ
ص
ض
ط
ظ
غ
Translittération
ḥ
ḳ
ṣ
ḍ
ṭ
ẓ
ṙ
La translittération des lettres interdentales « ث », le « ذ » par un trait sous les lettres latines qui les représentent :
Lettre arabe
ث
ذ
Translittération
ṯ
ḏ
Tableau récapitulatif de toutes les lettres arabes translittérées suivant ce modèle :
Lettre
translittération
Lettre
translittération
ء
ض
ḍ
ب
b
ط
ṭ
ت
t
ظ
ẓ
ث
t
ع
c
ج
j
غ
ṙ
ح
ḥ
ف
f
خ
ḳ
ق
q
د
d
ك
k
ذ
d
ل
l
ر
r
م
m
ز
z
ن
n
س
s
ه
h
ش
ṡ
و
w
ص
ṣ
ي
y
La translittération des voyelles courtes et longues :
Il peut être codé par plusieursjeux de caractères, parmi lesquels ISO-8859-6 etUnicode, grâce au bloc « Arabe », des emplacements U+0600 à U+06FF. Ces deux jeux, cependant, n'indiquent pas pour chaque caractère la forme contextuelle qu'il doit prendre. C'est au moteur de rendu de sélectionner le bonœil. Il existe cependant, dans le cas où l'on voudrait coder une forme particulière d'un caractère, les blocs « Formes de présentation arabe A » (U+FB50 à U+FDFF) et « Formes de présentation arabe B » (U+FE70 à U+FEFF), qui contiennent la majorité des caractères convalescents entièrement en variante contextuelle ainsi que les caractères étendus propres à d'autres langues. Il est aussi possible d'utiliser les liants sans et avec chasse. Enfin, le codage de l'arabe est logique, c'est-à-dire qu'on entre les caractères à la suite sans se soucier du sens de l'écriture. C'est encore une fois au moteur de rendu qu'il revient d'afficher les caractères dans le bon sens. À cet égard, si les mots arabes de cette page sont affichés à l'envers, c'est que votre moteur de rendu Unicode n'est pas assez récent. Pour plus de détails concernant les questions de codage de l'arabe, consultez la traduction française du manuel d'Unicode, disponible sur le siteHapax.
↑Certaines écritures, dont lexiao'erjing, ont introduit des voyelles.
↑Par exemple, à propos de l'épigraphie en langue arabe, l'inscription d'an-Namara(en) (Syrie) dite « linteau du tombeau d'Imru'-l-Qays », datée de 328 - conservée audépartement des Antiquités orientales duLouvre (Inv. AO 4083) - est enécriture nabatéenne. Voir aussi legraffito arabe du Ǧabal ’Usays daté de 528-529, découvert puis publié par Muḥammad Abū al-Faraj al-ʿUsh en 1964 (Al-Abhath=(ISSN0002-3973), 17-3, p. 227-316), et aussi considérée comme « la plus ancienne inscription qui soit à la fois en arabe, en écriture arabe et parfaitement datée » (Pierre Larcher, « Épigraphie et linguistique : l’exemple du graffito arabe préislamique du Ǧabal ’Usays », dansRomano-Arabica XV Graffiti, Writing and Street Art in the Arab World, Bucharest, 2015, p. 95 (en ligne). Pour plus de détails à ce sujet (comme les inscriptions deQaryat al-Faw duIIe siècle av. J.-C.), voirChristian Robin, « Les plus anciens monuments de la langue arabe », dansRevue du monde musulman et de la Méditerranée, 61, 1991 [L'arabie antique de Karib'îl à Mahomet - Nouvelles données sur l'histoire des Arabes grâce aux inscriptions], p. 113-125 (en ligne). Voir, à propos du caractère exceptionnel de l'inscription trilingue :Françoise Briquel-Chatonnet,Alain Desreumaux et Widad Khoury, « Inscriptions syriaques de Syrie. Premiers résultats », dansAnnales archéologiques arabes syriennes, XLVII-XLVIII [2004-2005], Damas, 2008, p. 189 et n. 20 p. 193 où il est signalé qu'une nouvelle édition de l'inscription est en préparation (en ligne).
↑ab etcHistoire de l'écriture, James Février, Payot 1984, p. 269.
↑Charles Schier,Grammaire arabe, Leipsic(sic), Librairie Arnold, 1872, § 9c, p. 7[lire en ligne (page consultée le 23 octobre 2020)]
↑Louis-Jacques Bresnier,Cours pratique et théorique de langue arabe, Alger, Librairie Bastide, 1855, p. 225.[lire en ligne (page consultée le 23 octobre 2020)]
↑Notice sur les divers genres d'écriture ancienne et moderne des arabes, des persans et des turcs. A. P. Pihan, prote de la typographie orientale à l'imprimerie impériale. Paris, 1857
Mohammed Sadid,L'alphabet arabe et la technologie, 1993, 414 p.
The World's Writing Systems, ouvrage collectif sous la direction de Peter T. Daniels et William Bright, article « Arabic Writing » de Thomas Bauer, Oxford University Press, 1996
Unicode : Applet java gratuite pour générer la chaine Unicode de mots écrits en caractères arabes :http://www.arabunic.free.fr (utile pour internationaliser les codes Java)