A föníciai ábécé és megfelelői négy modern ábécében. Balról jobbra: latin, görög, föníciai, héber, arab
A latinság valószínűleg kétféle irányból,etruszk közvetítéssel és dél-itáliai közvetítéssel ismerte meg aföníciai ábécét. A kétféle eredeztetés közötti pontos viszony megállapítása körül évszázados szakmai vita folyik. Hammerström szerint (Jensen, 521 o.) aB,D,O,X betűk egy olyan dél-itáliaigörög betűs írásból származnak, ami etruszk befolyás hatására tartalmazta ezeket a betűket (Sampson, 108 o.). Rix (203 o.) állítása szerint alatin nyelvben ezen betűk hangértékegörög nyelvi hatásra utal, maguk a betűk már mind léteztek, mikor Rómában használatba vették az etruszk ábécét (Wachter, 33 o.).
A kompromisszumos álláspont bizonyos betűk esetén tehátetruszk, más betűk esetén görög hatást feltételez. Az etruszkban nem volt zöngés zárhang, ezért aC a göröggamma átvételeként vált a zöngétlen [k] hanggá mind az etruszkban, mind a latinban. Jensen (521 o.) szerint aC,K,Q betűk használata a latinban megegyezett az etruszk használattal, azaz [e, i] előttC-t, [a] előttK-t, [u, o] előtt pedigQ-t írtak. (Ez utóbbi csak a latinra igaz, mert az etruszkban nem volt [o] hang.) A betűk elnevezése is e módszer szerint alakul: gamma/gemma, kappa, qoppa/quppa (Wachter, 15 o.). AzY ésZ betűket később, szintén a görögből kölcsönözték. AG-tSpurius Carvilius Ruga (i. e. 230 körül) alkotta aC-ből (Sampson, 109 o.). AzF (digamma) [w] hangot jelölt eredetileg, később az [f] hang jelévé egyszerűsödött. A [w, j] félhangzókat és az [u, u:, i, i:] magánhangzókatV-vel ésI-vel jelölték.
AW kétV egybeírásából keletkezett. A késő római korban került az ábécébe,germán nyelvek hatására. AzU-t és aJ-t eredetileg nem különböztették meg aV ésI betűktől. Az óangolban három –rúna eredetű – betűt adtak az ábécéhez: aþ-t (thorn), azð-t (edh) és aƿ-t (wynn) – azizlandi nyelvben az első kettő még ma is használatos.
Az ékezet (mellékjel, diakritikus jel) és kettős betűk nélküli latin ábécé az alábbi betűkből áll:
Nagybetűk
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
Kisbetűk
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
Mint látható, némely betűk – arányaiktól és méretüktől eltekintve – gyakorlatilag megegyeznek kis- és nagybetűs formájukban(c/C, k/K, o/O, p/P, s/S, u/U, v/V, w/W, x/X, y/Y, z/Z), illetve igen hasonlóak(i/I, j/J), míg mások csak némileg hasonlítanak(e/E, f/F, h/H, m/M, n/N, t/T) vagy akár számottevően eltérnek(a/A, b/B, d/D, g/G, l/L, q/Q, r/R).
Az előbbi csoporton belüli különbségtétel azoptikai karakterfelismerés terén is problémát jelenthet (ti. hogy képes-e aszoftver megkülönböztetni őket, főleg önálló helyzetben), akárcsak al (kis „L”) és azI (nagy „i”) betűk (valamint az1-es szám) különválasztása. Bizonyos betűk valamely betűkapcsolathoz hasonló kinézetűek, ami szintén megfelelő megoldást igényel OCR esetén: azrn például azm-hez, acl ad-hez, avv pedig aw-hez hasonló lehet (a hasonlóság mértéke betűtípustól függően eltér).
A kis- és nagybetűk köztitipográfiai különbség – nevükkel ellentétben – nem a méretükben rejlik, hanem abban, hogy a nagybetűk jellemzően azonos magasságúak, bár aQ és olykor aJ lenyúló szárral is előfordul. A kisbetűk közül felnyúló szárral rendelkezik ab, d, f, h, k, l, t, lenyúló szárral pedig ag, j, p, q, y betűk.
Egy betű,karakter vagy szimbólum (kiejtésüktől és kis–nagy betűs összefüggéseiktől függetlenül vett) vizuális megjelenési formáját glifának vagy íráselemnek (angolulglyph(en)) nevezik (ennek például az eltérő ábécék hasonló alakú betűinél van jelentősége, l. alább). Az egyazon betű(fogalom) alá tartozó különböző glifák neve allográf(en): a latin ábécét tekintve ide tartoznak a kis- és nagybetűk említett formai különbségei mellett például ag ésɡ,a ésɑ alakok (utóbbi főleg akurzív írásban), de azs betű archaikusſ formája is (amely pl. a németß-ben maradt fenn).
Venn-diagram a görög (balra fent), latin (jobbra fent) és cirill betűk (lent) átfedéseiről
Laikus szemmel is felfedezhetők az alak szerinti összefüggések egyescirill betűkkel: hangértékben is azА, Е, К, М, О, Т betűkkel, hangértékbeli eltéréssel pedig aВ, Н, Р, С, У, Х betűkkel (ejtve „v, n, r, sz, u, h”), illetve a kisbetűs, kurzívт-vel (ejtve „t”).
Agörög ábécén belül azΑ,Β,Ε,Ζ,Κ,Μ,Ν,Ο,Ρ,T,Υ, a hangértéktől eltekintve pedig azΙ,Χ nagybetűkkel látható ma is a kapcsolat, ezek kisbetűs formái közül azonban csak azε,κ,ο,τ feleltethetők meg könnyen latin betűs megfelelőjüknek a kiejtésük szerint, míg aν,ρ,υ,χ,ω kiejtése eltér a latin ábécé által sugallt kiejtéstől.
A hasonló kinézetű betűkethomoglifáknak nevezik(en) (nem azonos az egyező írásmódú, de eltérően ejtetthomográfokkal egyazon nyelven belül). A Görögországban kiadott rendszámtáblák a görög ábécének csak azon betűit használhatják, amelyeknek van homoglifája a latin ábécében, mivel az Európai Unió a latin betűk használatát írja elő.
Ha egyazon szövegben (akár egyazon mondaton belül) fordulnak elő különböző ábécékből származó, hasonló vagy azonos megjelenésű betűk, azonosításuk szintén jelentős kihívás azoptikai karakterfelismerés szempontjából. Azadathalászat megelőzésekor lényeges szempont azon linkek kiküszöbölése, amelyekben latin betűk helyett más ábécékből származó vagy egyéb okból összetéveszthető (lI) betűk, illetve hasonló szimbólumok szerepelnek, vö.IDN homograph attack (angolul).
A történelem folyamán a latin ábécét átvette számos újonnan kifejlődött nyelv is saját használatára. Természetesen ezen nyelvek hangrendszerét nem fedte le teljesen a latin írás, ezért ezek néhány új betűt alkottak számos mellékjelet alkalmazva, például:
acedilla (franciásancédille) aç-ben (eredetileg egy kisz ac alatt), amely az [sz]-es ejtést szimbolizálja: azóspanyolból származik, majd számos újlatin nyelv átvette, de atörök és azalbán nyelvbe is bekerült [cs] hangértékkel; érdekesség, hogy a modern spanyolban már nem használják (helyettez-t írnak),
ahacsek(haček) a szláv nyelvekben, egyes betűk lágyítását jelölik vele, pl.č,
atilde a spanyolñ-ben és néhány portugál magánhangzón (eredetileg egy kisN a betű fölé írva), amely az egykorin kiesését, ezzel együtt a hangnazalizációját is jelöli,
Anémetben négy, egykorligatúraként használatos betűkapcsolatból alakult ki új betű:ae → ä, oe → ö, ue → ü,ſs →ß. Afranciában használatos tetős ékezet (circumflex) a korai formákból eltűnt mássalhangzókat (elsősorbans-et) jelöli (ezek eredeti formái megtalálhatóak más nyelvekben, például az angolban is): ófranciahostel → franciahôtel = angolhotel vagy késő latinpasta → középfranciapaste → franciapâte = angolpaste.
A legtöbb speciális betűt tartalmazó nyelv avietnámi, atónusjelek kombinációival együtt 134-féle mellékjeles betűvel,[1]Európán belül pedig alengyel: ez utóbbi jelöli egyes betűk lágyságát, a kétféle [l]-et stb. A többi latin írású szláv nyelvben is találhatunk számos – főként hacsekkel módosított – mellékjeles betűt. Ahausza nyelv három különlegesmássalhangzót használ, ezek:ɓ, ɗ ésƙ.
Afranciában és azangolban atrémával ellátott betűket egyformán kezeljük, és ha két egyforma szót csak a tréma különböztet meg, akkor az ékezetes szó kerül hátrébb.
Anémet nyelvben az umlautos (Ä,Ö,Ü) betűket nem kezeljük külön alapváltozatuktól (kivéve a telefonkönyvekben, ahol azae, oe, ue kapcsolatok között találhatók), aß pedig mindig azss között lelhető fel.
Asvédben és adánban aW csak változata aV-nek, nem különálló betű. A svéd nyelv három különleges betűje a normál latin ábécé végén található: …, X, Y, Z,Å,Ä,Ö. Ezzel megegyező afinn betűrend is. Ugyanezeket a hangokat a dán ésnorvég nyelvben más sorrendben rendezzük: …, X, Y, Z,Æ,Ø,Å. AzAa változata azÅ-nak, ezért ide rendezzük.
Régebben aspanyol betűrendben különálló betű volt aCH és azLL is (példáulCINCO, CREDO, CHISPA ésLOMO, LUZ, LLAMA). 1997-ben aSpanyol Királyi Akadémia (RAE) változtatott e szabályozáson, azóta ezeket a betűkapcsolatokat tartalmazó szavakat tagonként (tehát: c+h és l+l) rendezzük sorba. AzÑ (eñe) önálló betűként kezelendő mindkét szabályozás szerint.
Aholland betűrendben azIJ-t egykoron azY változatának tartották, és a betűrendben az ilyen szavakat vagy y-ként, vagy az y utáni betűként kezelték. Manapság tagonként, tehát az i-s szavak közé sorolva rendezzük őket. AzIJ-jel kezdődő szavakban mind azI-t, mind aJ-t nagybetűvel írjuk (pl.IJssel-tó).
Amagyar nyelvben az ékezetes betűket többnyire nem kezeljük külön alapváltozatuktól – az ö, ü külön betűnek számít, de itt sem különböztetjük meg a rövid és a hosszú formákat. Az úgynevezett szoros ábécében viszont az ékezetes betű az ékezettelen után következik (pl.Eger, egér, éger)
Azizlandi nyelv az ábécé végére illesztette aÞ-t és aD után azÐ-et.
Alengyel nyelv számos speciális betűt tartalmaz: A, Ą, B, C, Ć, D, E, Ę, …, L, Ł, M, N, Ń, O, Ó, P, …, S, Ś, T, …, Z, Ź, Ż.
Acseh nyelvben az ékezetes magánhangzókat nem különböztetjük meg az alapváltozatuktól, a hacsekkel módosított mássalhangzók mindig alapváltozatuk után állnak. ACH mindig aH után rendeződik.
Azeszperantó nyelvben a tetős ékezettel (circumflex) ellátott betűk (Ĉ,Ĝ,Ĥ,Ĵ,Ŝ) és a félhangzós u (Ŭ) különálló betűként kezelendő: …, C, Ĉ, D, E, F, G, Ĝ, H, Ĥ, I, J, Ĵ, K, …, S, Ŝ, T, U, Ŭ, V, Z.
Arománban a speciális betűket az alapváltozatuk után rendezzük, különálló betűként: A, Ă, Â, …, I, Î, …, S, Ş, T, Ţ, …, Z.
Atatár nyelv speciális betűit az alapbetűk után rendezzük.
A latin betűvel íródéli szláv nyelvekben (horvát,szlovén stb.) a mellékjeles és az összetett betűk az alapbetűk után állnak: …, C, Č, Ć, D, Dž, Đ, E, …, L, LJ, M, N, NJ, O, …, S, Š, T, …, Z, Ž.
Jensen, Hans. 1970. Sign Symbol and Script London: George Allen and Unwin Ltd. Die Schrift in Vergangenheit und Gegenwart(németül) VEB Deutscher Verlag der Wissenschaften. 1958 (a szerző átdolgozott művénekangol nyelvű fordítása)
Rix, Helmut. 1993. „La scrittura e la lingua” In: Cristofani, Mauro (szerk.) 1993. Gli etruschi – Una nuova immagine. Firenze: Giunti. 199–227. o.(olaszul)
Sampson, Geoffrey. 1985. Writing systems. London (etc.): Hutchinson
Wachter, Rudolf. 1987. Altlateinische Inschriften: sprachliche und epigraphische Untersuchungen zu den Dokumenten bis etwa 150 v. Chr. Bern (etc.): Peter Lang(németül)