语系 是同一个祖语 分化出来的所有语言 组成的集合 。“语系”的概念是建立在这样一种假设上面的:有一些现在我们看到的语言,从历史角度讲,是来自同一种语言的;那种语言因为分化而形成了现在的这些语言,就像一个祖先繁衍出诸多后代那样[ 1] 。如果有多种语言是由同一种语言演化而来的,那么我们就说这种语言是它们的共同祖先,就管它叫这些语言的“祖语”,并且说这些语言是同源的,或者是有亲属关系[ 1] 的。[ 2]
汉藏语系 各种语言之间的亲缘关系,以树状图 的形式展现。其中每一种语言都是原始汉藏语 的后代同一语系的语言还可以按照亲缘关系的远近分出语族、语支等子集 。这里说的亲缘关系,指的乃是分化的早晚,分化晚的,关系就近。一个语系先分化为多个语族,一个语族再分化为多个语支,语支又分化成不同的语言。[ 2]
语义相通、语音相近的单词 ,称为同源词;通过比较不同语言的单词,可以得出的同源词之间的语音对应规律,这是分析语言的亲属关系时最重要的判断依据。相似的屈折变化 方式也是一种重要的判据,但是这种判据遇到没有或者很少有屈折变化的语言,就难以派上用场。[ 3] :30-33
语音对应规律的实例:北京话与广州话[ 3] :71 可 看 苦 阔 欠 轻 劝 去 北京话 /kʰɤ/ /kʰan/ /kʰu/ /kʰuo/ /tɕʰiɛn/ /tɕʰiŋ/ /tɕʰyɛn/ /tɕʰy/ 广州话 /ho/ /hon/ /fu/ /fut/ /him/ /hiŋ/ /hyn/ /høy/ 这八个字的声母本来都是相同的。 在北京话中,这个声母在/i/ 之前(即汉语音韵学 所说的“四呼 ”中的“齐齿呼”中) 或者/y/ 之前(即“撮口呼”中)变成/tɕʰ/ ,否则演变成/kʰ/ ; 在广州话中,这个声母在/u/ 之前(即“合口呼”中)变为/f/ ,否则演变成/h/ 。
不同语言之间相似的单词,可能是同源词,也可能是因为接触其他语言产生的借词 ,后者在判断语言亲属关系时没有考虑的价值。同源词之间存在语音对应关系,而借词则不然,可以通过这一点把两者区别开来;特定类型的单词,比如文化词语和科学术语,因为容易相互借用,也不适合作为比较的对象。有时无关的语言之间还会因为巧合而出现伪同源词 ,比如,德语 的“nass 語言代码 deu 已升格为代码 de ”与祖尼语 ( 英语 : Zuni language ) 的“nas ”都表示“潮湿”;这种情况在比较语言学研究中也是不应予以考虑的。[ 3] :33,74-75 音节结构 、声调 、基本语序 之间的相似性或者差别,也不能证明或证伪两种语言的亲缘关系,因为这些特点容易在非同源的语言之间扩散[ 4] 。
在判断亲缘关系时,一般只有基本核心词和屈折变化 是适宜用来比较的。基本核心词包括代词 、亲属称谓 、身体部位的名称、颜色的名称 ( 英语 : color term ) 、非常常见的动词、形容词等。[ 3] :75
在实践中,给语言进行谱系分类往往也会依靠语言类型学 、历史学 、考古学 、分子人类学 的证据。[ 4]
世界主要语系的分布 根据Ethnologue 于2025年发布的数据,以下为使用人数超过一百万的口语 语系:[ 5]
# 语系名称 现存 语言 数量 使用人数 语言举例 1 印欧语系 446 3,386,224,992 英语 、法语 、德语 、西班牙语 2 汉藏语系 461 1,471,174,615 汉语 、缅甸语 、藏语 、不丹语 3 亚非语系 376 667,919,943 阿拉伯语 、希伯来语 、阿姆哈拉语 、豪萨语 4 尼日尔-刚果语系 1,532 658,854,150 斯瓦希里语 、卢旺达语 、祖鲁语 、约鲁巴语 5 南島語系 1,221 383,800,568 印度尼西亚语 、马来语 、他加禄语 、爪哇语 6 达罗毗荼语系 84 257,460,680 泰米尔语 、马拉亚拉姆语 、泰卢固语 、坎纳达语 7 突厥语系 39 195,887,738 土耳其语 、阿塞拜疆语 、乌兹别克语 、哈萨克语 8 南亚语系 167 128,064,130 越南语 、高棉语 、桑塔利语 、孟语 9 日本-琉球语系 12 124,856,090 日语 、冲绳语 、奄美大岛语 10 壯侗語系 89 92,209,638 泰语 、老挝语 、壮语 、傣语 11 朝鲜语系 2 81,191,970 朝鲜语 、济州语 12 尼罗-撒哈拉语系 204 75,335,430 杰尔马语 ( 英语 : Zarma language ) 、卢奥语 、卡努里语 、丁卡语 13 乌拉尔语系 37 19,408,944 芬兰语 、匈牙利语 、爱沙尼亚语 、马里语 14 苗瑶语系 39 10,063,460 苗語 、勉語 、布努语 15 克丘亚语系 44 7,285,740 克丘亚语 16 图皮语系 65 6,823,566 瓜拉尼语 、现代图皮语 ( 英语 : Nheengatu language ) 17 玛雅语系 31 6,563,798 尤卡坦玛雅语 、基切語 、凯克奇语 ( 英语 : Qʼeqchiʼ language ) 18 蒙古语系 14 6,546,780 蒙古语 、卡爾梅克語 19 南高加索语系 5 4,186,532 格鲁吉亚语 、明格列尔语 20 东北高加索语系 31 4,123,290 车臣语 、阿瓦尔语 、列茲金語 、印古什語 21 跨新几内亚语系 477 3,835,997 恩加语 ( 英语 : Enga language ) 、卡泰语 ( 英语 : Kâte language ) 、梅德尔帕语 ( 英语 : Melpa language ) 22 西北高加索语系 4 2,744,860 阿布哈兹语 、阿迪格语 、卡巴尔达语 23 猶他-阿茲特克語系 59 2,076,904 纳瓦特尔语 24 奥托-曼克亚语系 178 1,743,425 米斯特克語 、奥托米语 ( 英语 : Otomi language ) 、特拉帕内克语 ( 英语 : Tlapanec language ) 25 艾马拉语系 ( 英语 : Aymaran languages ) 3 1,677,840 艾马拉语
有些语言无法与任何语言归类到同一个语系里面,它们被称为孤立语言 [ 6] ,包括巴斯克語 、布鲁沙斯克语 、阿伊努语 等。Ethnologue 第28版列出了107种孤立语言,其中79种现仍存活[ 5] ;Glottolog第5.2版则列出了184种[ 7] 。[ 8]
1786年,威廉·琼斯 在亚洲学会 ( 英语 : The Asiatic Society ) 演讲时提出,梵语 与拉丁语 、希腊语 是同源的;这就已经隐含了“印欧语系 ”这个假设,只是还未正式提出这一概念[ 3] :29 。琼斯又在1814年正式提出了“印-欧”(Indo-European)这一名称,用以描述这两个地区的某些语言之间的联系。[ 1]
印欧语系语言的历史比较语言学研究获得了可观的成就。这让学者们意识到语系的假设是正确的,推进了其他地区的语言学研究采取类似的方法。有些学者假设,也存在其他一些能归类到同一个语系之中的语言集合,汉藏语系 的概念就是这样提出的。[ 3] :30
非洲
欧洲
亚洲不含高加 索地区
大洋洲含马来群 岛东部
北美洲 含中美洲
南美洲 黄色背景 :语言的区域分类 ,语言间没有亲属关系斜体 :有争议的分类星号:有观点认为不属于上级分类