世界主要语系的分布 语系 是同一个祖语 分化出来的所有语言 组成的集合 [ 1] 。判断两种语言是否属于同一语系,最主要的方式是对比其核心词汇是否同源 。语系的下层分类包括语族、语支等。使用人数最多的语系有印欧语系 、汉藏语系 、亚非语系 等,汉语 属于汉藏语系。无法归类到任一语系的语言称为孤立语言 。
“语系”这一概念是建立在这样一种假设上面的:有一些现在我们看到的语言,从历史角度讲,是来自同一种语言的;那种语言因为分化而形成了现在的这些语言,就像一个祖先繁衍出诸多后代那样[ 2] 。如果有多种语言是由同一种语言演化而来的,那么我们就说这种语言是它们的共同祖先,就管它叫这些语言的“祖语 ”,并且说这些语言是同源的,或者是有亲属关系[ 2] 的。[ 1]
如果两种语言有相似之处,那么这种相似性可能源自语言学共性 ( 英语 : linguistic universal ) 、语言接触 、巧合,或者源自共同的祖语 。如果最后一种解释最有说服力,那么可以把这两种语言归入同一个语系。[ 3]
有些语言之间可以找出语义相通、语音相近的单词 ,称为同源词 ;同源词之间的语音对应规律,是分析语言的亲属关系时最重要的判断依据。相似的屈折变化 方式也是一种重要的判据,但是这种判据遇到没有或者很少有屈折变化的语言,就难以派上用场。[ 4] :30-33
语音对应规律的实例:北京话与广州话[ 4] :71 可 看 苦 阔 欠 轻 劝 去 北京话 /kʰɤ/ /kʰan/ /kʰu/ /kʰuo/ /tɕʰiɛn/ /tɕʰiŋ/ /tɕʰyɛn/ /tɕʰy/ 广州话 /ho/ /hon/ /fu/ /fut/ /him/ /hiŋ/ /hyn/ /høy/ 这八个字的声母本来都是相同的。 在北京话中,这个声母在/i/ 之前(即汉语音韵学 所说的“四呼 ”中的“齐齿呼”中) 或者/y/ 之前(即“撮口呼”中)变成/tɕʰ/ ,否则演变成/kʰ/ ; 在广州话中,这个声母在/u/ 之前(即“合口呼”中)变为/f/ ,否则演变成/h/ 。
不同语言之间相似的单词,可能是同源词,也可能是因为接触其他语言产生的借词 ,后者在判断语言亲属关系时没有考虑的价值。同源词之间存在语音对应关系,而借词则不然,可以通过这一点把两者区别开来;特定类型的单词,比如文化词语和科学术语,因为容易相互借用,也不适合作为比较的对象。有时无关的语言之间还会因为巧合而出现伪同源词 ,比如,德语 的“nass 語言代码 deu 已升格为代码 de ”与祖尼语 ( 英语 : Zuni language ) 的“nas ”都表示“潮湿”;这种情况在比较语言学研究中也是不应予以考虑的。[ 4] :33,74-75 音节结构 、声调 、基本语序 之间的相似性或者差别,也不能证明或证伪两种语言的亲缘关系,因为这些特点容易在非同源的语言之间扩散[ 5] 。
在判断亲缘关系时,一般只有基本核心词和屈折变化 是适宜用来比较的。基本核心词包括代词 、亲属称谓 、身体部位的名称、颜色的名称 ( 英语 : color term ) 、非常常见的动词、形容词等。[ 4] :75
在实践中,给语言进行谱系分类往往也会依靠语言类型学 、历史学 、考古学 、分子人类学 的证据。[ 5]
汉藏语系 各种语言之间的亲缘关系,以树状图 的形式展现。其中每一种语言都是原始汉藏语 的后代同一语系的语言还可以按照亲缘关系的远近分出语族、语支等子集 。这里说的亲缘关系,指的乃是分化的早晚;分化晚的,关系就近。一个语系先分化为多个语族,一个语族再分化为多个语支,语支又分化成不同的语言。[ 1]
以印欧语系 为例。印欧语系包含日耳曼语族 、罗曼语族 、凯尔特语族 、波罗的语族 、斯拉夫语族 、印度-伊朗语族 这几个语种较多的语族,以及各自单独构成一个语族的希腊语 、阿尔巴尼亚语 、亚美尼亚语 ,此外还包括已灭绝的安纳托利亚语族 和吐火罗语族 。其中日耳曼语族又分为西日耳曼语支 、北日耳曼语支 、东日耳曼语支 。[ 6]
有些语言无法与任何语言归类到同一个语系里面,它们被称为孤立语言,包括巴斯克語 、布鲁沙斯克语 、阿伊努语 等。仅包含单个孤立语言的集合 有时也被视为仅含有一种语言的语系。Ethnologue 第28版列出了107种孤立语言,其中79种现仍存活[ 7] ;Glottolog第5.2版则列出了184种。[ 8] [ 3]
Ethnologue 第28版认为世界上共有143个语系,Glottolog第5.2版则认为有246个[ 3] 。这些语系中,语种数量排在前六名的依次是尼日尔-刚果语系、南岛语系、跨新几内亚语系、汉藏语系、印欧语系、亚非语系,每一个的语种数量都超过了世界语言总数的百分之五。[ 9]
根据Ethnologue于2025年发布的数据,使用人数超过一百万的口语 语系有25个,依使用人数排列如下[ 7] :
# 语系名称 现存 语种 数量 使用人数 语言举例 1 印欧语系 446 3,386,224,992 英语 、法语 、德语 、西班牙语 2 汉藏语系 461 1,471,174,615 汉语 、缅甸语 、藏语 、不丹语 3 亚非语系 376 667,919,943 阿拉伯语 、希伯来语 、阿姆哈拉语 、豪萨语 4 尼日尔-刚果语系 1,532 658,854,150 斯瓦希里语 、卢旺达语 、祖鲁语 、约鲁巴语 5 南島語系 1,221 383,800,568 印度尼西亚语 、马来语 、他加禄语 、爪哇语 6 达罗毗荼语系 84 257,460,680 泰米尔语 、马拉亚拉姆语 、泰卢固语 、坎纳达语 7 突厥语系 39 195,887,738 土耳其语 、阿塞拜疆语 、乌兹别克语 、哈萨克语 8 南亚语系 167 128,064,130 越南语 、高棉语 、桑塔利语 、孟语 9 日本-琉球语系 12 124,856,090 日语 、冲绳语 、奄美大岛语 10 壯侗語系 89 92,209,638 泰语 、老挝语 、壮语 、傣语 11 朝鲜语系 2 81,191,970 朝鲜语 、济州语 12 尼罗-撒哈拉语系 204 75,335,430 杰尔马语 ( 英语 : Zarma language ) 、卢奥语 、卡努里语 、丁卡语 13 乌拉尔语系 37 19,408,944 芬兰语 、匈牙利语 、爱沙尼亚语 、马里语 14 苗瑶语系 39 10,063,460 苗語 、勉語 、布努语 15 克丘亚语系 44 7,285,740 克丘亚语 16 图皮语系 65 6,823,566 瓜拉尼语 、现代图皮语 ( 英语 : Nheengatu language ) 17 玛雅语系 31 6,563,798 尤卡坦玛雅语 、基切語 、凯克奇语 ( 英语 : Qʼeqchiʼ language ) 18 蒙古语系 14 6,546,780 蒙古语 、卡爾梅克語 19 南高加索语系 5 4,186,532 格鲁吉亚语 、明格列尔语 20 东北高加索语系 31 4,123,290 车臣语 、阿瓦尔语 、列茲金語 、印古什語 21 跨新几内亚语系 477 3,835,997 恩加语 ( 英语 : Enga language ) 、卡泰语 ( 英语 : Kâte language ) 、梅德尔帕语 ( 英语 : Melpa language ) 22 西北高加索语系 4 2,744,860 阿布哈兹语 、阿迪格语 、卡巴尔达语 23 猶他-阿茲特克語系 59 2,076,904 纳瓦特尔语 24 奥托-曼克亚语系 178 1,743,425 米斯特克語 、奥托米语 ( 英语 : Otomi language ) 、特拉帕内克语 ( 英语 : Tlapanec language ) 25 艾马拉语系 ( 英语 : Aymaran languages ) 3 1,677,840 艾马拉语
非洲
欧洲
亚洲不含高加 索地区
大洋洲含马来群 岛东部
北美洲 含中美洲
南美洲 黄色背景 :语言的区域分类 ,语言间没有亲属关系斜体 :有争议的分类星号:有观点认为不属于上级分类