现代的越南语是一种和汉语非常接近的语言,甚至可以说是和汉语最为接近的一种外语。这样说是因为越南语在历史上受到了汉语非常深入的影响,目前其词汇中至少有60%以上都是源自汉语。而且越南语也和汉语一样,是世界上为数不多的声调语言之一,按照评判标准的不同,现代越南语里有6到8个声调。除此之外,越南语的语法也曾受到汉语语法的深入影响,比如和汉语一样也基本没有通过词缀表达语法作用,主要语序是主谓宾等。另外,越南在历史上还曾长期使用汉字。但即便如此,在国内外语言学主流的研究中,却基本还是把越南语归入了南亚语系之中,和汉语所属的汉藏语系并不一致,而不同的语系归属也就意味着这两种语言在起源上还是不同的。那么越南语为什么会被归入南亚语系?南亚语系又包括哪些语言?它起源于哪?又有着怎样的历史呢?
越南语为啥属于南亚语系?
刚才我们已经列举了越南语和汉语非常类似的几个方面,可以说无论在词汇还是在语法方面,越南语都可以说是和汉语最为接近的语言之一。特别是在词汇方面,越南语里的汉语词汇至少能占到其总词汇的60%左右。
而在越南语的汉语词汇里,又大致可以分成3类,即古汉越词、汉越词和越南化的汉语词。其中的古汉越词是指唐代以前进入越南语的汉字词汇,目前仍然保留在越南语里的此类词汇有飞(bay)、帆(buom)、房(buong)等等单字,这些单字虽然也是来自汉语,但其音韵和占据越南语中汉语借词主体的汉越词却并不一致。
而越南语中的汉越词主要是指在唐代前后由汉语传入越南语的词汇,而这些词汇构成了越南语中汉语借词的主体,在整个越南语词汇中占到了至少60%。在政治、经济和法律等领域则占到了70%到80%。所以其实这些词涉及越南语的方方面面,在现代越南语中,类似科学(khoa hoc)、教育(giao duc)、政治(chinh tri)、历史(lich sir)、和平(hoa binh)、病院(benh vien)等等等等日常词汇可以说都是汉越词。
因为汉越词在越南语中是如此普遍的存在,所以在越南语中甚至形成了一整套的汉字音读体系,而这些词汇的读音和唐宋时期汉字的读音确实有相当程度的对应。所以这些词汇也就是大家感觉越南语和汉语接近的主要原因了。而除此之外,越南语中还有少量近代从汉语借入越南语的汉语词,虽然这些词汇的读音也都有一定的越南化,但和汉越词也存在差异,因此也单独被视为了一类。
除此之外,越南语的总体语音和语法上也受到了汉语深入的影响。比如在原始越南语里,是和其它南亚语系的语言一样,存在大量的屈折形式,也就是通过词缀表达语法含义(英语里的动词词尾加ing表示进行时,加ed表示过去时就是这种语法形式的一个简单例子)。但因为越南语长期受到汉语的影响,现代越南语里这种情况已经非常罕见。另外原始越南语里存在复杂的复辅音,如比如bl、gl、ml和mnh这种几个辅音(声母)连读的现象,因为汉语的影响,现代这种情况也已经非常少见。而越南语里的声调可以说也是完全源自汉语的影响,在其它南亚语系语言里基本不存在。
但尽管如此,越南语里这些汉语的影响却也很明显都是最近这两千年左右的时间里从中国传入的,其中许多甚至在史料上都有据可查。所以虽然近代越南语和汉语非常接近,却并不代表两种语言的起源接近。而在最能说明语言起源的基本词汇方面,也就是人称、数词、亲属关系和身体部位等词汇方面,越南语跟同属南亚语系的孟语和高棉语有大量同源词,跟汉藏语系的语言却很不一样。另外虽然越南语的语法已经受到了汉语极为深入的影响,其一些最基本的语法结构却仍然和南亚语系其它语言基本相同。而且越南语中仍然大量存在(接近40%)的纯越南语词汇,而这些词汇都跟汉语完全不相关,所以总体上越南语的起源和汉语乃至汉藏语系还并不是一个体系,它仍然被主流学者归入了南亚语系之中。
南亚语系所包括的语言
那么说到这,我们也就必须要简单介绍一下南亚语系究竟包括哪些语言了。其实南亚语系在中文里有时又被称为澳亚语系,但在桃花石杂谈看来这两个中文名称都有一定误导性。首先虽然在英语等欧洲语言里,南亚语系是指“南部亚洲”的语言(Austroasiatic languages),但它用来指代南方的词是Austro,而这个词是源自拉丁语,和很多现代欧洲语言用来指代南方的词south或者sud等不一样,所以在欧洲语言里不会被人认为是指印度、巴基斯坦、孟加拉等南亚次大陆地区。
而澳亚语系这个称呼则是借用了澳大利亚的汉语译名用字,其实澳大利亚的国名和南亚语系确实有些联系,因为“澳大利亚”(Australia)这个国名的本义就是南方大陆,是指古希腊和罗马时期欧洲传说里的一块位于地球南方的未知大陆,后来欧洲人抵达澳大利亚之后直接把那块传说大陆的名字套用在了大洋洲这块大陆上。但在汉语里,“澳”这个字很容易让人联想到澳大利亚,所以如果叫“澳亚语系”又会让人误会其中的语言包括一些大洋洲语言。
但其实南亚语系跟大洋洲或者澳大利亚是八竿子打不着的。而虽然南亚语系确实包括一些存在于南亚国家的语言,但南亚语言主要的语言其实是一些存在于东南亚的语言。
具体说来,南亚语系包括168种语言,其中最大的一种就是越南语。而除了越南语之外,南亚语系中还包括有柬埔寨的国语高棉语,缅甸和泰国的主要少数民族孟族所说的孟语,我国和老挝、缅甸和泰国等国的少数民族佤族所说的佤语以及在南亚各国有相当数量使用者的桑塔利语等等。
而从全球角度看,说南亚语系各语言的人口总数大约是1.2亿人左右,其中8500万左右都是越南人,或者说是越南的主体民族京族人(目前越南总人口已超过1亿,其中有1500万左右的少数民族),而柬埔寨的总人口为1600万左右,其中高棉人大约有1300万人。此外,在印度的22种法定受保护语言中,有一种名为桑塔利语的语言也属于南亚语系,说这种语言的人目前大约有700万人,分布于南亚各国境内。
而在南亚语系内部,又可以大致分成蒙达和孟-高棉两个语族,蒙达语族就是指分布于南亚各国的一些族群所说的语言,包括前文所提到的桑塔利语等语言。而孟-高棉语族则包括越南语、高棉语和孟语等主要分布于东南亚各国的将近100种语言。而其中越南语在孟-高棉语支下又属于越芒语支,这个语支中除了越南语之外,还有一个叫做芒语的语言。这是越南少数民族芒族的语言,而芒语和现代的越南语其实非常接近,只是其中的汉语借词要少得多,所以也在一定程度上可以被视为一种没有被汉化的越南语。
南亚语系族群的迁徙过程
不过,虽然现代主流的学者认为南亚语系是一个独立的语系,跟汉藏语系或者其它语系没有共同起源,但许多学者也认为,说南亚语系的族群和说汉藏语系等东亚语言的族群在南亚语系出现之前的历史上还是有共同起源的。
这些学者认为,在差不多5万年前,多数东亚、东南亚乃至美洲土著族群的先祖都属于一个共同的族群。而在距今大约2.5万到1.5万年前,说南亚语系各族群的先祖与东亚各族群和美洲土著各族群的先祖发生了初步分化。差不多在这个时期,东亚远古族群的一个分支迁到了今天印尼和马来西亚所在的东南亚海岛地区,并逐渐取代了当地的原住民,即现代澳大利亚等国土著的先祖,成为了当地的主导族群,而他们也就成了南亚语系各族群的先祖。
而在此后差不多3000年时间里,也就是在距今1.5万年前到1.2万年前这段时间里,南亚语系各族群的先祖成为了东南亚海岛地区的霸主。但从1万年前开始,南亚语系各族群的先祖又受到了今天南岛语系(今天印尼、马来、菲律宾、夏威夷等族群所说语言)各族群先祖的排挤。他们大部分逐渐被挤出了东南亚海岛地区,回到了亚洲大陆,少部分则被南岛语系种族同化。
在5000多年前到4000多年前,南亚语系的先祖从今天中国境内的长江流域进入了中南半岛。关于他们迁徙的路线,目前有经过岭南、经过云南和沿着越南沿海等几种说法,而原初南亚语也差不多就在这个时期形成,关于其形成的具体地点,目前有红河三角洲地区和湄公河中段等几种假说,这些地点基本都位于中南半岛地区。而现代基因研究认为,当时这批人的父系基因可能主要是在东亚和东南亚不同族群中都有一定分布的O1b。
而在这些人进入中南半岛之后不久,他们之中又有一部分人向西展开了扩张。这些人在距今4000多年到3000多年前进入了南亚次大陆地区,并在当地站稳了脚跟。而他们也就是今天印巴孟等南亚次大陆国家南亚语系各族群的祖先了。而近代通过基因等学科的研究还进一步发现,这波进入南亚次大陆的南亚语系先祖很可能基本完全是男性,因为今天印度、巴基斯坦和孟加拉国等国说南亚语系的各个族群父系基因有超过一半以上也都是O1b,但其母系甚至则基本是南亚当地基因,所以今天南亚次大陆各个南亚语系族群可以说都属于混血族群了。
而在距今大约2500年前,留在了中南半岛的南亚语系族群内部再次出现了显著分化,越南和高棉等等孟-高棉语族的不同语支开始形成,原初南亚语不复存在,南亚语系的各个语言也开始了自己各有不同的演化路径。当然,最后我们要说明的是,这些南亚语系各族群先祖的早期历史都是近代学者根据语言学、遗传学(基因研究)和考古发现推断出来的,因此也很自然存在一定程度的争议,这也是多数情况下人类早期历史研究不可避免的情况了。(图片来自网络)