此条目介紹的是字母文字的一種組字形態。
關於東亞方塊字的一種組字形態,請見「疊字 」。 關於婆罗米系文字的一種組字形態,請見「半字 」。 12ptGaramond 字模:长s 与i的连字 合字 、連字 、連結字 或合體字 (英語:Ligature ),在西方字体排印学中一般表示將多於一個字母的合成一個字形。如印刷品中常常将拉丁字母 两个字母fi 的i 上一點常與f 的一鈎合併,而德語 字母ß 原為ss等等。漢字的合字在不同情況下也稱作合文 或合體字 。
合字經過演變、長時間流行後,可能被視為直接的符號 、文字 而非合字。如W 源自VV或UU,Æ 源自AE,而表示「與」的意思的「& 」,原是e和t的合字。
印刷合字单纯源于手写本中连写的字符。以发现的最早的楔形文字 手写本中就已经含有很多连写字符。中世纪的拉丁文 手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字 ,如在哥特体 中,带右圈的字母(b ,o ,和p )和带左圈的字母(c ,e ,o ,d ,g 和q )的圈部都被重叠书写。很多手写本字符如h ,m 和n 的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。
当活字印刷 诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线 字体广泛使用,以及1970年代照相排版 技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版(之后激光打印机)之一的是高德納 的Te X 程序(详见下文)。这一潮流也影响到了1985年之后的桌面排版 技术。早期电脑软件无法进行合字替换(但Te X 可以),大部分新制作的电脑字体 裡也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。
随着现代电脑处理的多语言化和现代电子排版技术(如OpenType )的流行,合字开始逐渐恢复被使用。
拉丁文本中的典型合字 fi和fl 许多合字都把字母f 和其后的字符组合起来,最常用的就是fi (或fi ,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母i 上的点会抵挡到字母f 的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把i的点融入f的勾来直接使用。其他f合字包括fj 、[ 1] fl (fl)、ff (ff)、ffi (ffi)、和ffl (ffl)。其他合字包括fa 、fe 、fo 、fr 、fs 、ft 、fb 、fh 、fu 、fy ,以及f 后加句号 、逗号 或连字符 ,还有不太常用的双写ff 和fft 。
使用这些合字是因为通常的小写字母 f 中弧形勾影响字符间距调整。
有时,跨词合字(如shelfful [ 2] 的ff )是不希望出现的,电脑程序(如Te X )提供手动方式将它们分开。一些字体带有fff 合字(如Requiem 体甚至包括一个fffl 合字)用于德语的复合词,如Sauerstoffflasche (氧气罐)和Schifffahrt (游艇)(仅在遵循1996年拼写改革法的前提下才写作fff )。正式的德文正寫法 ,如杜登词典 所述,不赞成跨词合字,由于fff 组合在德文中只会在组合词出现如(Schiff-fahrt 、Sauerstoff-flasche ),所以这样跨词合字在德文中使用会被认为是不正确的。[ 3] 英语中类似的例子则是Shelfful 。
土耳其语 中有带点和不带点的字母I ,如单词fırın (烤箱)和fikir (主意)。fi 合字容易混淆,所以在土耳其文排印中一般不使用该合字。像fl 合字一般也不用,土耳其语本来就没有这样的拼写。
“ß”写作“ſʒ”合字的例子。柏林街头的标识(Petersburger Straße )。右边的标识(Bersarinplatz )最后一个字是tʒ合字。 合字ſʒ (sz)和tʒ (tz)来自德语哥特体 ,现在街头、城市广场的标识中带Platz 或者以-platz 结尾时仍常被使用。
有时st (st)、ſt (ſt)、ch 、ct 、Qu 以及Th 的合字也被使用(如字体Linux Libertine )。
德语 中eszett 合字(亦称scharfes S 「清S」)ß ,其名称es-zett(意为「S-Z」)表示其源自「长S加Z」或「長S在圓S之上」。尽管「长s」ſ 已经在现代德文正寫法消失了,ß仍被保留并被视为合字,传统上在大写的时候以及字母排序的时候改写为「SS」。2008年其大写字母「ẞ」加入Unicode并出现更多字形。ß仅在德国和奥地利使用,瑞士德文不用这个合字。
Adobe Caslon Pro 中的合字字母W 是7世纪 左右才被加入拉丁字母 表的,其发音不尽相同。古英语 使用盧恩字母 Ƿ (Wynn),但受到諾曼人 影響後废弃不用。14世纪,这个起源于双写的V 或U 的“新”字母W 诞生并在字母表中占有一席。由于它相对于其他字母比较年轻,只有很少欧洲语言(英语、荷兰语、德语、波兰语、威尔士语 、馬耳他語 和瓦龍語 )使用它来拼写本土词汇。
字符Æ (小寫æ ,中世紀時稱為aesc )作为一个字符在丹麥語 、挪威语 、冰岛语 以及古英语 中使用,并不是一个印刷用的合字。它是一个实在的字母 ——代表一个元音 ,且在字母表中有位置。现代英文正寫法中Æ 不作为一个单独字母,而只是一种拼写异形,如百科全书的英文单词encyclopædia也可拼写成encyclopaedia或encyclopedia。
Æ 源自中世纪 拉丁文,当时只是一些词汇的随意合字如Æneas。它还可以在英文和法文中出现,但是现在已经倾向把A 和E 分開印刷。[ 4] 同样,Œ 和œ 在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。
在德文正寫法 中,带两点的字母元音ä 、ö 和ü 來自历史上的ae 、oe 、ue 合字(严格的说是標在顶端的e,即aͤ ,oͤ ,uͤ )。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母ae、oe、ue 。字母排序中它们不等价于ae 、oe 、ue ,而是被简单看成a 、o 、u 。而北欧 语言则不同:带两点的字母被视为独立字母,并排在字母表最后。
一些元音中的圈形附加符号 ,如å 起源于一个o 合字[ 5] 。现在把旧式aa改写为å 已经称为不成文习惯,但在此之前也可写成a上再加一个小a(aͣ ),如Johannes Bureus、Runa ABC boken[ 6] 。
uo 合字ů 的使用实例也在早期现代高地德语 裡找到,但其后来混同到u 中(如中期高地德语 的fuosz 、早期现代高地德语 fuͦß 、现代德语 Fuß )。它仍存在于捷克语 中,被称为kroužek 。
西班牙语 和葡萄牙语 中的上波浪线,分別用於字母ñ 表示元音鼻音化 ,起源于一个nn 合字[ 7] (Espanna = España、anno = año)。同样法语中的抑揚符 也源自不发音s。[ 8] 法语、葡萄牙语、西班牙语等中的字母ç 其实是一个字母c盖在一个z上面的形式。
字母ƕ (Hwair)仅用于转写哥德語 ,代表hw 合字。最早在1900年左右心理学者使用这个字用于代替二合字母hv 用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。
拜占庭帝国 有一个独特的合字Ȣ (o-u合字),它源于希腊字母的ο-υ 两个字母的合字,并被加入到了字母表中。
ƣ (Gha)是一个罕见的字母,起源于Q和G,但在ISO 的文件中误注成O-I合字(参见Unicode 注解)。
国际音标 使用合字来表示塞擦音 ,其中6个有Unicode编码:ʣ、ʤ、ʥ、ʦ、ʧ、ʨ 。一个擦音 仍使用合字:ɮ ,而国际音标扩展 裡加入了另外三个:ʩ、ʪ、ʫ 。
还有一些罕见合字,如Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ 。
Et合字(Insular Minuscule的写法) 最常用的合字符号当属& 。它起源于E 和t 的合字,即拉丁文 的单词“和”(et)。它在法文中保持原音原意而在英文中也使用。由于其使用广泛,一般已经不认为它是一个合字而是一个普通符号。
和其他合字一样,它被仍当作一个字母来使用(如早期现代英语),英语中它念作and而不是et,而&c 念作et cetera(等等)。大多数字体中的字形和两字直接组合不一样,但仍有一些字体(如Trebuchet MS )就把& 设计为合字。
同样,美元符号$ 可能也起源于合字(“pesos”,但有也有其他不同说法),但现在实际上已经被当成一个普通符号。[ 9] 西班牙比塞塔 (peseta)也有时被写作合字₧(源自Pts)。
大写IJ 字形看起来像“断臂的U ”合字(Helvetica 字体,由OmegaTe X 渲染) 二合字母 ,如西班牙语 和威尔士语 中的ll ,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母ch 和ll 已经被考虑为分开的两个字母。
法文的情况也一样,œu 被看成为合字œ 与字母u 的组合。
尽管如此,荷兰语 中“ij ”的定位比较模糊。根据不同的使用标准,它可看成是一个二合字母,或合字,或者一个独立字母。它有独立的大小写形式,而在一些专业字体中,通常是有一个独立字形也有合字(如Zapfino )。无衬线字体 大写字母的IJ 流行于荷兰 ,通常形状像是一个断左臂的U 。更令人混淆的是,手写时可以把小写字母y 写作没有点的ij ,和大写字母IJ (同样没有点)看起来只是大小差异而已。而Y 在本土荷兰语词汇中不被使用。
合字不仅出现在拉丁文本中:
婆罗米系文字 的元音附标文字 频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的天城文 ,用于梵文 的合字就要比印地文 多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。微软Windows 系统附带的Mangal 等字体带有印地语支持,但不能正确处理在द, ट, ठ, ड,和ढ右边的辅音合字,而只是加怛達點畵 后按照一般形式显示在辅音之后。希腊字母 中使用一些合字,特别是在Ο (Omicron)和Υ (Upsilon)连写并衍生出一个西里尔字母 。参见Ȣ 字母。西里尔合字:Љ 、Њ 、Ы 、Ѿ 。Iotified 西里尔字母是早期西里尔字母І 和其他元音的合字:Ꙗ (Я 的前身)、Ѥ 、Ѩ 、Ѭ 、Ю (源自另外一个合字Ѹ ,У 的早期形式)。塞尔维亚语字母表中的两个字母Љ 和Њ 在19世纪曾分别是Л 、Н 与软音符号 (ь )的合字。还有一个Я 和Е 的合字:Ԙԙ ,其他合字包括Ꚅ、ꚅ 和 Ꚉ、ꚉ 。 格拉哥里字母 的一些手写形式:用于中世纪到19世纪书写的斯拉夫人语言,多为方形且常用合字。在希伯来语 中字母א (Aleph )和ל (Lamed )在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为[ʔ][a]l- (在希伯来文中写作aleph 加lamed )是阿拉伯语中的定冠词 。 阿拉伯文 :各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的mīm ,单独书写为م ,三个连写(mmm ,显示为词头,词中,词尾形)就变为ممم 。注意lām +ʼalif 的情况是特殊的:ﻻ ,lām + ʼalif在词中、词尾形式是ﻼ 。在Unicode有几个特殊的合字,如安拉 位于U+FDF2:ﷲ ;太斯米 位于U+FDFD:﷽ 等。乌尔都语 使用阿拉伯文字纳斯塔里格体 的手写体,在电子排印中有大量合字。乌尔都语最常用的排版工具InPage 使用纳斯塔里格体字体产生多达20,000个合字。藏文 在Unicode有一个特殊的合字U+0F00:ༀ (唵 )。日文 自江戶時代起便有以把文字組合在一起形成文字繪 的遊戲,例子有へのへのもへじ 。漢字 中如招財進寶 ( )[ 10] [ 11] 、孔孟好學( )、日進斗金、双喜 傳統上經常會合为一字书写,称为合文 ,另外还有大量叠字 流传至今。近年,也有网民将“草泥马 ”“Duang ”等字编成合文。Te X 是电脑排版系统中能使用合字的典型程序。它能提供五个常用合字:ff 、fi 、fl 、ffi 和ffl 。当Te X 遇到这些组合时会自动替换成合字。当然操作者可以手动切换。
OpenType 字体格式可以针对一个字符提供多个字形 ,因此用来作为合字替换,但需要软件支持。Xe Te X 就是一个可以运用这一优势的Te X 排版引擎。这种替换原先主要用于阿拉伯文排版,但现在已经广泛用于西文OpenType字体。OpenType中,这些是标准liga、历史性hlig、上下文clig、需求性rlig和任意性dlig合字。这些在CSS3 中可用font-feature-settings启用或禁用。[ 12]
CSS 还支持font-variant-ligatures特效。common-ligatures、discretionary-ligatures、historical-ligatures和contextual特效也被支持。[ 13]
下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的操作系统 和浏览器 并调用正确的Unicode电脑字体 。
Unicode 中对合字的处理不是一个字符定义,而是一种绘制形式。即Unicode不把合字当作一个字符,而是把合字处理为字符序列,由字形绘制系统去处理是否用合字的字形在屏幕上显示或者打印。比如,如果一个现代字体需要显示h后加r,且该字体确实有hr合字,这个合字才会被显示出来。因此,使用特殊Unicode合字字符是“不鼓励”且“在任何环境下不会被再度编码”的。[ 14] 注意,合字æ和œ不能随意替代ae和oe,比如does不能写作dœs。
这是一个不完整列表。U+A732到U+A73D区域及其临近区域的一些字符没有列出。 非合字 合字 Unicode HTML et & U+0026 & ſs、ſz ẞ 、ß U+1E9E、U+00DF ẞ、ß AE、ae Æ 、æU+00C6、U+00E6 Æ æ OE、oe Œ 、œU+0152、U+0153 Œ œ IJ、ij IJ 、ij U+0132、U+0133 IJ ij ue ᵫ U+1D6B ᵫ TZ、tz Ꜩ 、ꜩ U+A728、U+A729 Ꜩ ꜩ AA、aa Ꜳ 、ꜳ U+A732、U+A733 Ꜳ ꜳ AO、ao Ꜵ 、ꜵ U+A734、U+A735 Ꜵ ꜵ AU、au Ꜷ 、ꜷ U+A736、U+A737 Ꜷ ꜷ AV、av Ꜹ 、ꜹ U+A738、U+A739 Ꜹ ꜹ AY、ay Ꜽ 、ꜽ U+A73C、U+A73D Ꜽ ꜽ OO、oo Ꝏ 、ꝏ U+A74E、U+A74F Ꝏ ꝏ ui ꭐ U+AB50 ꭐ ff ff U+FB00 ff fi fi U+FB01 fi fl fl U+FB02 fl ffi ffi U+FB03 ffi ffl ffl U+FB04 ffl ſt ſt U+FB05 ſt st st U+FB06 st eT 🙰 U+1F670 🙰
另外,Dz 、克罗地亚语和波斯尼亚语字母 DŽ、LJ和NJ都有单独的码位。它们不是合字而是二合字母 。
仅在标音 时使用的合字 非合字 合字 Unicode HTML db ȸ U+0238 ȸ qp (cp) ȹ U+0239 ȹ lʒ (或lezh)ɮ U+026E ɮ dz ʣ U+02A3 ʣ dʒ (或dezh)ʤ U+02A4 ʤ dʑ (或dz curl)ʥ U+02A5 ʥ ts ʦ U+02A6 ʦ tʃ (或tesh)ʧ U+02A7 ʧ tɕ (或tc curl)ʨ U+02A8 ʨ fŋ ʩ U+02A9 ʩ ls ʪ U+02AA ʪ lz ʫ U+02AB ʫ
U+0238和U+0239是二合字母,但实际上是合字。[ 15]
计量单位 的合字除个别符号外绝大多数编成合字形式的计量单位的符号收录于CJK Compatibility(U+3300到U+33FF)区域中 非合字 合字 Unicode HTML °C ℃ U+2103 ℃ °F ℉ U+2109 ℉ fm ㎙ U+3399 ㎙ nm ㎚ U+339A ㎚ μm ㎛ U+339B ㎛ mm ㎜ U+339C ㎜ cm ㎝ U+339D ㎝ dm ㍷ U+3377 ㍷ km、KM ㎞ 、㏎ U+339E、U+33CE ㎞ ㏎ μg ㎍ U+338D ㎍ mg ㎎ U+338E ㎎ kg ㎏ U+338F ㎏ cal ㎈ U+3388 ㎈ kcal ㎉ U+3389 ㎉ μl ㎕ U+3395 ㎕ ml ㎖ U+3396 ㎖ dl ㎗ U+3397 ㎗ kl ㎘ U+3398 ㎘ Pa ㎩ U+33A9 ㎩ kPa ㎪ U+33AA ㎪ mPa ㎫ U+33AB ㎫ GPa ㎬ U+33AC ㎬ pA ㎀ U+3380 ㎀ nA ㎁ U+3381 ㎁ μA ㎂ U+3382 ㎂ mA ㎃ U+3383 ㎃ kA ㎄ U+3384 ㎄ pV ㎴ U+33B4 ㎴ nV ㎵ U+33B5 ㎵ μV ㎶ U+33B6 ㎶ mV、MV ㎷ 、㎹ U+33B7、U+33B9 ㎷ ㎹ kV ㎸ U+33B8 ㎸ pW ㎺ U+33BA ㎺ nW ㎻ U+33BB ㎻ μW ㎼ U+33BC ㎼ mW、MW ㎽ 、㎿ U+33BD、U+33BF ㎽ ㎿ kW ㎾ U+33BE ㎾ kΩ ㏀ U+33C0 ㏁ MΩ ㏁ U+33C1 ㏂ Hz ㎐ U+3390 ㎏ kHz ㎑ U+3391 ㎐ MHz ㎒ U+3392 ㎑ GHz ㎓ U+3393 ㎒ THz ㎔ U+3394 ㎓ KB ㎅ U+3385 ㎅ MB ㎆ U+3386 ㎆ GB ㎇ U+3387 ㎇ lm ㏐ U+33D0 ㏐ ln ㏑ U+33D1 ㏑ lx ㏓ U+33D3 ㏓ mol ㏖ U+33D6 ㏖ rad ㎭ U+33AD ㎭ rad/s ㎮ U+33AE ㎮ ps ㎰ U+33B0 ㎰ ns ㎱ U+33B1 ㎱ μs ㎲ U+33B2 ㎲ ms ㎳ U+33B3 ㎳
^ 字母组合fj 在英语 中仅有fjord 和fjeld 中出现,但加上世界语 、挪威语 和其他j代表半元音[j]的语言 ^ Helmut Kopka; Patrick W. Daly. A Guide toLaTeX , 3rd Ed.. Addison-Wesley. 1999: 22.ISBN 0201398257 . 引文使用过时参数coauthors (帮助 ) ^ Duden 1, Mannheim 1996, p. 69. ^ The Chicago Manual of Style、14th Ed. Chicago: The University of Chicago Press. 1993: 6.61. ^ 905-906 (Nordisk familjebok / Uggleupplagan. 33. Väderlek - Äänekoski) . runeberg.org. 2017-09-12 [2010-03-19 ] . (原始内容存档 于2012-10-24). ^ 存档副本 . [2010-02-05 ] . (原始内容 存档于2010-01-24). ^ AulaHispanica.com . [2010-03-19 ] . (原始内容存档 于2010-07-02). ^ Teach Yourself French. Collier's Cyclopedia、1901. ^ Cajori, Florian.A History of Mathematical Notations . New York: Dover (reprint). 1993.ISBN 0-486-67766-4 . - contains section on the history of the dollar sign, with much documentary evidence supporting the theory $ began as a ligature for "pesos".^ 搜查線:招財進寶合體字 由溥儀創造? . 東方日報. 2016年10月11日 [2019年5月20日] . (原始内容存档 于2019年6月12日). ^ 蛤?!這些「組合字」春聯竟然還有讀音 「招財進寶」唸… . 三立新聞網. 2016年2月8日 [2019年5月20日] . (原始内容存档 于2018年2月20日). ^ font-feature-settings property . MSDN. MSDN. [24 November 2014] . (原始内容存档 于2015-01-10). ^ CSS font-variant-ligatures Property . CSS Portal. [2014-11-29 ] . (原始内容存档 于2015-02-22). ^ Ligatures, Digraphs and Presentation Forms (页面存档备份 ,存于互联网档案馆 ), Unicode FAQ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken.Known Anomalies in Unicode Character Names . Unicode Technical Note #27.Unicode Inc . 2006-05-08 [2009-05-29 ] . (原始内容存档 于2009-04-21). 引文使用过时参数coauthors (帮助 )