南島語系(英文名:Austronesian family),又稱“馬來-波利尼西亞語系”,是按譜系分類法劃分的一個語系,也是世界上唯一主要分布在島嶼上的一個語系。其分布地區西自非洲東南的馬達加斯加島,東至智利的復活節島,北至中國臺灣省和夏威夷島,南至新西蘭。南島語系分為4個語族:印度尼西亞語族、密克羅尼西亞聯邦語族、美拉尼西亞語族、波利尼西亞語族。截至2009年,《文化人類學視角的世界諸語言》把南島語系的語言增加到1257種,使用人口近4億。南島語系屬黏著型語言。詞根附加成分和詞根的重疊是構詞和構形的主要手段。常用詞大多為多音節。語序屬謂主式。
原始南島語(Proto-Austronesian,簡稱pan)是整個南島語系的祖先語言。有關南島語言的起源,學界觀點多種多樣。主要有四類:一類認為起源于中南半島沿海一帶;一類認為起源于中國大陸華南地區;一類認為起源于馬來群島的西新幾內亞島;最后一類認為起源于臺灣島,并由臺灣島開始向外擴散到菲律賓群島北部、馬里亞納群島群島、印度尼西亞等地。1706年,荷蘭人H.萊蘭特發現了南島諸語言的親屬關系。1784年,西班牙語言學家洛倫索·埃爾瓦斯-潘杜羅(Lorenzo Hervás y Panduro)在其著作《宇宙理念》(Idea dell‘宇宙)中語言學相關的部分便提出,應當將馬來半島、馬達加斯加、印尼、菲律賓和太平洋島嶼等地的語言聯系在一起建構一個新的語系。1906年,威廉·施密特提出了南島語系(Austronesian)和南亞語系(Austroasiatic)的命名,Austronesian才開始用來指代這個語系,并在20世紀60年代中期之后被廣泛接受。
1942年,本尼迪克特(Paul Bennedict)研究發現南島語與泰語(壯侗語,Tai)、加岱語(Kadai)存在同源關系,后來他將南島、壯侗、加岱甚至苗瑤語統一歸類為澳泰語系(Austro-Tai)。1992年,鄧曉華的研究表明壯侗語與南島語確實存在同源關系,證據是二者都有一批反映原南島人文化的底層詞,這些詞屬于日常生活基本詞匯,借用的可能性很小。20世紀90年代,漢語與南島語的關系開始被學界重視。沙加爾(Laurent Sagart)最早提出漢(語)南(島語)同源說,認為二者之間存在發生學關系。進入21世紀以來,中國學者利用歷史比較語言學或結合考古人類學、分子人類學方法來驗證南島民族起源假說,在探討南島語系與漢藏語系、南亞語系的關系,以及確定回輝話的性質等方面,都有一定程度的突破。
語系命名
“南島”(Austronesia),是由兩個希臘文字的字根au-stro-與-nesia組合而成,前者為南方之意,后者意指群島,所以“Austronesia”可以翻譯成“南島”,Austronesian即南島語。1899年,威廉·施密特(W.Schmidt)在《孟高棉人群——中亞人和南島人之間的連接》中正式用“南島語”(Austronesischen Sprachen)一詞來取代“馬-波語系”。1906年,威廉·施密特在其南方大語系(Austric languages)的假說體系下,提出了南島語系(Austronesian)和南亞語系(Austroasiatic)的命名,Austronesian才開始用來指代這個語系,并在20世紀60年代中期之后被廣泛接受。
歷史演變
起源
南島語系的起源一直是語言學研究的熱點問題之一。有關南島語言的起源,學界觀點多種多樣。有人說它源于南亞語系,有人說它源于印歐語系,有人說它源于漢藏語系。起源地有密克羅尼西亞聯邦、華南、臺灣島、印度尼西亞、中南半島、新幾內亞島西部等不同地區的說法。絕大多數認為是臺灣島。臺灣島是南島語系的源頭,泰雅族聚落是目前全世界南島語人群地理分布上最北端的聚落,而臺灣島原住民在南島文化中又占有舉足輕重的地位。福建平潭殼丘頭遺址群與臺灣大坌坑文化存在淵源關系,兩地出土的貝齒紋陶器和農業遺存表明該地區是南島語族文化符號體系和技術傳播的重要節點。總的來說,現階段有關南島系語言起源的觀點歸納起來主要有四類:一類認為起源于中南半島沿海一帶;一類認為起源于中國大陸華南地區;一類認為起源于馬來群島的西新幾內亞;最后一類認為起源于臺灣島,并由臺灣島開始向外擴散。
自20世紀80年代起,線粒體脫氧核糖核酸被用來研究世界上不同族群之間的遺傳演化歷史關系。英國遺傳人類學家梅爾頓等人的線粒體DNA研究結果顯示玻利尼西亞人群起源于臺灣島,而另一些線粒體DNA研究對此提出不同看法,認為玻利尼西亞人群其實起源于印度尼西亞東部。2008年,是由喬納森·弗里德蘭德(Jonathan Friedlaender)所率領的國際團隊進行的,他們對太平洋地區41個族群中的952個個體進行了研究。作者不同意大多數研究者以某個或數個單倍體為示蹤指標的做法,而是分析了687類基因指標,既包括線粒體脫氧核糖核酸,也包含Y染色體。分析結果顯示,波利尼西亞人和密克羅尼西亞聯邦人與東亞,尤其是中國臺灣原住居民的基因聯系最密切,而與美拉尼西亞人關系甚遠。這一結果不僅表明中國臺灣和相鄰的大陸地區是南島語族的基因發源地,而且支持南島語族在近大洋洲一帶遷徙速度很快的觀點。
2014年,德國馬克斯·普朗克進化人類學研究所的團隊從位于福建閩江口外馬祖亮島上時間可追溯至8400年前的人骨提取DNA,并以單倍體E為示蹤指標,結果清楚地表明,生活在東南亞群島和近大洋洲地區的南島語族的基因發源地就在福建沿海。2016年至2018年,斯科格蘭在《自然》、利普森在《當代生物學期刊》、波斯特在《自然生態與進化》等國際學術刊物上陸續發表了數篇與太平洋島嶼古人類脫氧核糖核酸相關的文章,系統全面地展示了南島語族在太平洋島嶼上的遷徙與擴散。認為所有東南亞島嶼的南島語人群與臺灣南島人群具有強烈的親緣關系,同時也接受了來自大陸中南半島說南亞語人群的遺傳貢獻,這種南亞語相關的遺傳貢獻有可能是因為在南島語人群遷徙之前,東南亞島嶼就已有說南亞語人群的存在;又或是南島語人群經由中南半島走廊而后再擴散至印度尼西亞東部地區。
2020年5月14日,由中國科學院古脊椎動物與古人類研究所的付巧妹團隊進行的研究。他們成功地在福建省的奇和洞、曇石山和溪頭遺址的史前人骨中提取了脫氧核糖核酸,其結果更進一步證明:福建地區新石器時代的人群是西太平洋地區各島嶼上的南島語族的祖先。
發展
原始南島語本身是重建的結果,包含整個南島語系的祖先詞匯,以及它的祖先音系和許多語法特征。語言學家們在整個南島世界現存語言中尋找共有的繼承性同源詞,從而重建了該語言。原始南島語(Proto-Austronesian,簡稱pan)是整個南島語系的祖先語言。這一觀點最初由語言學家白樂思提出,獲得了絕大多數現代語言學家的認同。根據大多數語言學家的說法,在南島人定居臺灣島之前,南島語的祖先語言業已存在,分布于中國大陸沿海地區,源頭在長江以南的某個地方。經過早期的大陸祖先階段之后,最初的南島語開始在臺灣島傳播,后來島上的原始南島語分裂,成為現代某些或所有土著南島語的根源。但是,被稱為馬來-波利尼西亞語的南島語分支在今天的臺灣島并不存在。一般認為這個語支的源頭是在臺灣島,由臺灣島擴散到菲律賓群島北部,并在菲律賓群島北部發生了語言分化,逐漸遠離了臺灣島的母語。傳播范圍并不限于菲律賓群島,原始馬來-波利尼西亞語后來從島嶼東南亞傳播到大洋洲——先到馬里亞納群島,然后稍晚從菲律賓群島或印度尼西亞等地,經過美拉尼西亞,到達東波利尼西亞,向西又傳播到馬達加斯加。最終波利尼西亞人在公元13世紀到達新西蘭。
1521年,麥哲倫探險隊開始首次環球航行時便與關島以及菲律賓的薩馬島、宿務島和馬克坦島等島嶼土著人群有所接觸和沖突,并在與馬克坦島的部落沖突中被殺。此后的16-18世紀,來自歐洲的不同探險家和學者記錄了東南亞、太平洋島嶼和馬達加斯加的多種文化和語言,為后來的研究者識別出這些語言之間的聯系奠定了重要的材料基礎。1706年荷蘭人H.萊蘭特發現了南島諸語言的親屬關系。1784年,西班牙語言學家洛倫索·埃爾瓦斯-潘杜羅(Lorenzo Hervás y Panduro)在其著作《宇宙理念》(Idea dell‘宇宙)中語言學相關的部分便提出,應當將馬來半島、馬達加斯加、印度尼西亞、菲律賓和太平洋島嶼等地的語言聯系在一起建構一個新的語系。
1800年,埃爾瓦斯出版了《語言目錄》,繼續論證馬來語和波利尼西亞語之間的發生學關系,真正系統地建立起“馬來-波利尼西亞語系假說”。1838年,德國哲學家和語言學家F.W.von洪堡(FriedrichWilhelm von Humboldt,1767~1835)首次使用科學的證據,在《論爪哇島上的卡維語》一書中仔細研究了馬來半島和波利尼西亞一帶九種語言的詞匯表,并首次把這些語言置于“馬來-波利尼西亞語系”之下。1899年,德國學者W.施密特(WilhFSchmidt,1868~1954)在他的文章中采用南島語(Austronesian)這個詞取代了“馬來-波利尼西亞語”。施密特還按地將南島語系分為四組,即印度尼西亞語、波利尼西亞語、美拉尼西亞語和密克羅尼西亞聯邦語。19世紀末,荷蘭學者柯恩(Hendrik Kern)就對110多種南島語言中的30組同源詞進行了研究,據此構擬出原南島語(Proto-Austronesian),并對南島語族的原居地進行了推測。
1978年,白樂思把南島語一分為四,其中三支在臺灣地區,分別是泰雅語、鄒語和排灣語;臺灣地區以外的南島語合為一支,稱為馬來-波利尼西亞語。同時,白樂思還把馬來-波利尼西亞語進一步區分為西馬來-波利尼西亞語、中東部馬來-波利尼西亞語兩支,后者再進一步分為中支和東支,東支又分為南哈爾馬哈拉-西新幾內亞島語和大洋洲語。這一分類已成為有代表性的主流派的意見。其他學者在白樂思的基礎上進一步地完善臺灣地區以外南島語的分類,將西馬來-波利尼西亞語區分為巴丹語群、北菲律賓語群、巽他語群和蘇拉威西語群四支。
后來,白樂思又提出新的分類,把南島語系分為10個主要語支,即鄒語、西部平原語、西北臺灣南島語、泰雅語、東部臺灣民語、布農語、魯凱語、卑南語、排灣語和馬來-波利尼西亞語。其中九個語支在臺灣地區,馬來-波利尼西亞語包括所有臺灣地區外的南島語以及臺灣島上的一種語言。2000年,B.F.格蘭姆斯(Barbara F.Grimes,美國,1930~2014)編輯的《文化人類學視角的世界諸語言》把南島語系分為兩大次語系,即臺灣南島語和馬來-波利尼西亞語。前者包括23種語言,進一步分成泰雅語、排灣語和鄒語三大系統;后者則有1239種語言,分為中東部馬來-波利尼西亞語、西馬來-波利尼西亞語以及兩種尚無法歸類的語言。截至2009年,《文化人類學視角的世界諸語言》把南島語系的語言增加到1257種。
分布
世界
南島語主要分布在太平洋的島嶼和東南亞地區,西自非洲東南的馬達加斯加島,東至智利的復活節島,北至中國臺灣省和夏威夷島,南至新西蘭島,包括中國臺灣、馬來西亞、印度尼西亞、菲律賓、巴布亞新幾內亞、密克羅尼西亞聯邦、所羅門群島、瓦努阿圖、新喀里多尼西亞、馬紹爾群島、吉爾伯特環形山、薩摩亞、湯加、夏威夷、新西蘭、復活節島和馬達加斯加等地。
中國
中國臺灣地區是南島語系分布的最北端,居住在臺灣地區的南島語民族稱為高山族,使用的語言包括泰雅語、賽德克語、太魯閣國家公園語、鄒語、卡那卡那富語、沙阿魯阿語、魯凱語、布農語、排灣語、卑南語、賽夏語、阿美語、撒奇萊雅語、達悟語(也稱雅美語)、邵語、噶瑪蘭語等,使用人口約45萬。另外,海南省三亞市回輝、回新村的回族使用的回輝話也是一種南島語,使用人口近萬人(據三亞市政府2008年統計數字有9037人)。
內部分類
多樣化分類
南島語系的分類是基于系統性和科學性的原則進行的。學者們通過研究各種語言之間的詞匯、語音、語法等特征,以及歷史、文化和地理分布等因素,將它們劃分為不同的語系、語族、語支。這種分類方案是經過深入研究和論證的,具有一定的科學性和準確性。不過,南島語系語言的分類充滿了爭議和挑戰。由于南太平洋地區語言的復雜性和多樣性,確定性的分類方案很難找到。到了現代,隨著資料收集越來越多,各位學者的視角不同,導致分類越來越多樣化。
里德對南島語系語言進行了廣泛細致的研究,試圖將各種南島語系語言劃分為更為具體的語系和語族。他綜合考慮了詞匯、語音、語法等多個方面的特征,并結合歷史、文化和地理分布等因素,使用了明確的分類標準,因此他的分類在南島語系研究領域具有一定的影響力。由于南島語系語言的復雜性和多樣性,對它的分類學界很難達成一致。有些學者對托馬斯·里德的分類結果產生了質疑,并提出了不同的分類。
白樂思對南島語系進行了廣泛而深入的研究,并提出了自己的南島語分類。他基于語音、詞匯、語法等多個層面的語言特征,將南島語系劃分為多個下位語支,并對各個下位語支進行了詳細描述。白樂思把南島語系分為10個主要語支,即鄒語、西部平原語、西北臺灣南島語、泰雅語、東部臺灣民語、布農語、魯凱語、卑南語、排灣語和馬來-波利尼西亞語。其中九個語支在臺灣地區,馬來-波利尼西亞語包括所有臺灣地區外的南島語以及臺灣島上的一種語言。
2009年,羅斯(Malcolm David Ross)根據不同臺灣南島語的形態證據提出新的南島語系分類。他認為目前原始南島語的構擬實際上與某個中間階段相對應,稱為“原始核心南島語(Proto-Nuclear Austronesian)”。
此外,根據“民族語”網站上的分類,南島語系可以分為九大次語系:臺灣島東部原住民語(East Formosan languages)、臺灣島西北原住民語、布農語(Bunun)、泰雅語(Atayalic)、排灣語(Paiwanic)、卑南語(Puyuma)、魯凱語(Rukai)、西部平原語、馬來-玻利尼西亞語(Malayo-Polynesian languages),還有一種無法歸類的語言。
語族介紹
南島語系分為印度尼西亞語族、密克羅尼西亞聯邦語族、美拉尼西亞語族和波利尼西亞語族四個語族的四分法。
波利尼西亞語族
波利尼西亞語族一般指波利尼西亞人,波利尼西亞人(Polynesians)是大洋洲東部波利尼西亞群島的一個民族集團,包括毛利人、薩摩亞人、湯加人、圖瓦盧人、夏威夷人、塔希提人、托克勞人、庫克島人、瓦利斯人、紐埃人、復活節島人等10多個支系,共有90多萬人(1978年)。波利尼西亞人屬南方蒙古人種和澳大利亞人種的混合類型,身材中等偏高,皮膚為淺褐色,體毛較少,頭發為寬幅波狀黑發,面部寬大,略呈頜突。使用多種語言和方言,彼此差別不大,同屬南島語系波利尼西亞語族。
波利尼西亞語族分布在國際日期變更線以東,太平洋中部和東部的新西蘭、薩摩亞、湯加、紐埃、庫克、土阿莫土、馬克薩斯、瓦利斯、夏威夷、復活節島等島嶼上。包括毛利語、薩摩亞語、烏維亞語、湯加語、紐埃語、拉羅通加語、塔希提語、土阿莫土語、馬克薩斯語、夏威夷語、拉帕努伊語等共約100多種語言、方言和次方言。波利尼西亞語族語言的輔音有13個,元音有5個,但長短元音是不同的音位。語法特點是名詞前有不定冠詞和定冠詞,名詞的復數在前面加特殊的助詞,物主代詞有獨立形式,數詞一般是十進位計數法(夏威夷語和馬克薩斯語保存著古老的四進位計數法),形容詞的級用句法形式表示,動詞有時、體、態、式等語法范疇。謂語一般出現在句首。
北島現有20萬毛利人,大約有一半使用毛利語。毛利文采用拉丁字母。薩摩亞群島的西薩摩亞有12.5萬人,東薩摩亞有2.5萬人使用薩摩亞語。薩摩亞文采用拉丁字母。塔希提島約有5萬人使用塔希提語。塔希提文采用拉丁字母。湯加群島約有7.5萬人使用湯加語。湯加文采用拉丁字母。夏威夷群島上目前約有7500人使用夏威夷語。夏威夷王國文采用拉丁字母。瓦利斯群島約有5000人使用烏維亞語。紐埃約有5000人使用紐埃語。庫克群島約有5000人使用拉羅通加語。土阿莫土群島約有5000人使用土阿莫土語。馬克薩斯群島約有5000人使用馬克薩斯語。
美拉尼西亞語族
美拉尼西亞語族大約包括400種語言,大多與密克羅尼西亞聯邦語族及波利尼西亞語族相近,具體語言的使用人數從幾百到幾千不等。美拉尼西亞語族的語言幾乎沒有文字記載。斐濟語是美拉尼西亞語族中最重要的一種語言,使用人口約33.4萬,廣泛使用于斐濟的報刊、廣播及政府公告。其他有影響力的語言還包括莫圖語(Motu)、羅維阿娜語(Roviana)、班巴塔納語(Bambatana)、布戈圖語(Bugotu)、托萊語(Tolai)、雅比姆語(Yabem)和莫塔語(Mota)等。除有南島語系的一般特征外,美拉尼西亞語族語言的輔音有2個齒間音和7個軟腭化音,有4個二合元音。名詞按表示的事物與所有者關系的親疏可分成兩類。數詞有五進位計數法。動詞有人稱和數的語法范疇,用加短尾代詞表示。其使用者主要分布在美拉尼西亞群島。使用人數不足百萬。
印度尼西亞語族
印尼語族包括馬來-印度尼西亞語支、臺灣語支、占語支、巴丹語支等。我國南島語屬印度尼西亞語族,其中分布在臺灣本島的同屬臺灣語支,內部可分為三大語群:(一)泰雅語群,含泰雅(Atayal)、賽德克(Sediq)、太魯閣國家公園(Truku)語;(二)排灣語群,含排灣(Paiwan)、魯凱(Rukai)、布農(Bunun)、賽夏(Saisiyat)、阿美(Amis)、撒奇萊雅(Sakizaya)、卑南(Puyuma)語;(三)鄒語群,包含鄒(Tsou)、卡那卡那富(Kanakanavu)、沙阿魯阿(Saaroa)語等。另外,分布在蘭嶼島的雅美(Yami)語(即達悟語)屬菲律賓巴丹語支。此外,分布在海南三亞的回輝話屬占語支,于宋元之際從中南半島遷徙而來。印度尼西亞語族主要分布在印尼、中國、馬來西亞、菲律賓、馬達加斯加、越南、柬埔寨等國,使用人口1.1億多。
密克羅尼西亞語族
密克羅尼西亞語族是南島語系的語族之一,分布在赤道以北和國際日期變更線以西的馬里亞納、馬紹爾、加羅林、關島、吉爾伯特環形山、特魯克、波納佩、帕勞、雅浦、瑙魯等島嶼上。密克羅尼西亞語族包括馬紹爾語、查莫羅語、吉爾伯特語、特魯克語、波納佩語、帕勞語、雅浦語、瑙魯語、烏利蒂語、庫賽語、塞班語、耶魯托語。其中,馬紹爾群島群島約有2萬人使用馬紹爾語,馬紹爾文采用拉丁字母;關島約有4萬人使用查莫羅語,查莫羅文也采用拉丁字母;吉爾伯特群島約有4萬人使用吉爾伯特語;特魯克群島約有2.5萬人使用特魯克語;波納佩島約有1.5萬人使用波納佩語;帕勞群島約有1萬人使用帕勞語;雅浦島約有5000人使用雅浦語;瑙魯約有5000人使用瑙魯語;加羅林群島約有4000人使用烏利蒂語;庫賽島約有3600人使用庫賽語。該語族有軟腭化輔音和元音同化現象。名詞有數和領屬格范疇。人稱代詞有復雜的數和分類系統。動詞或動詞前的時態助詞加前加成分表示人稱和數。
語言特點
南島語系的語言特點因具體語言而異。每種南島語系的語言都有其獨特之處。南島諸語言屬黏著型,詞根加附加成分或詞根的重疊(或部分重疊)是構詞和構形的主要手段,附加成分有前加、中加和后加三類。
語法
德國學者丹波夫,日本學者小川尚義、淺井惠倫、土田滋,美國學者戴恩等都對古南島語語音做了擬測。該語系常用詞大多為雙音節;語法特點為人名、普通名詞、方位名詞分別加不同的冠詞;代詞有人稱和數的范疇,第一人稱復數有包括式和排除式兩種;動詞有時、體、態、式等范疇;數詞有十進位、五進位、四進位等計數法;大多數詞根既能用作名詞,也能用作動詞;詞序往往隨著謂語的性質而變動,謂語有的語言出現在句首,有的語言出現在主語之后。如大多數臺灣島語和菲律賓語的語序為VSO或VOS,否定助詞和否定標記可以在主動詞(main verb)之前。有些語言,如邵語和賽夏語,語序為SVO,可能是由于與漢語的長期接觸而產生的與漢語相似的語序。
蘇拉維西和印度尼西亞東部大多數語言的動詞都有前綴主語標記。在一些語言里,這些標記主語與完全自由代詞同時出現,表現出一致性。在美拉尼西亞西部的一些語言中,如摩圖語(Motu),動詞復合詞由前綴主語標記、動詞詞干和后綴賓語標記以及標記主語和賓語的自由名詞或代詞組成,產生了結構theman the dog he-kicked-it 而非 the man kicked the dog。在這種情況下,動詞復合詞的結構提供了線索,即,現在的SOV句子結構來源于早期的SVO。
重疊
南島語中的重疊有多種形式,表達多種功能。臺灣島魯凱語和菲律賓的他加祿語里動詞詞干的部分重疊用來標記將來時,如:他加祿語的l-um-akad“走”,la-lakad“將要走”;或者s-um-ulat“寫”,但是su-sulat“將要寫”。印度尼西亞的馬來語(Bahasa)使用完全重疊用來標記名詞復數,如anak是“孩子”,anak anak是“孩子們”。在許多語言里,重疊與詞綴一起使用表達各種語義差別。如印尼的anak anak-an“木偶”或orange orange-an“稻草人”只是多數現象中的一種。
音節規范
規范形狀(canonical shape)一詞是指一些語言在構詞中對音節的數量、輔音和元音的排序等表現出明顯的偏好,但許多南島語在實詞(具有參考而不是純粹語法功能的詞)中表現出對雙音節規范形狀的明顯偏好。這種偏好被其他力量打破,它經常通過特殊的機制重現。爪哇語?ri“刺”一定經過ri階段,后來為了迎合雙元音規范形狀才增加了一個央元音?。在南島語言中,還可以看到很多這種類型的、表現異常的例子。在大多數大洋洲語和其他地區的一些南島語里,所有詞語以元音結尾。這是兩種變化的結果:輔音丟失或增加“回聲(echo)”元音或不變的“支持(supporting)”元音。斐濟語和玻利尼西亞語由于第一類發展而表現出開放的尾音節;美拉尼西亞語西部和馬達加斯加語的姆騷語(Mussau)由于第二種發展而展現出開放的尾音節。
元輔音
大多數南島語有16-22個輔音,4-5個元音。美拉尼西亞南忠誠島上的語言就發現有非常多的輔音,而在玻利尼西亞語里輔音極少。夏威夷語音素很少,只有8個輔音(p,k,?,m,n,l,h,w)和5個元音(a,e,i,o,u)。南島語元音系統很簡單。臺灣島、菲律賓和印度尼西亞的許多語言只有4個對立元音:i,u,a和e,一個模糊的中央元音(mid-Central vowel)。絕大多數大洋洲語言有五元音系統:a,e,i,o,u。在很多密克羅尼西亞語、一些美拉尼西亞語(如瓦努阿圖北中部的薩卡奧語)和一些占語里,有大量的元音系統。有些罕見的南島語語音,如有些臺灣島語有小舌塞音(q),它的發音是將舌頭的最后部分向下拉,以接觸咽壁。很多加里曼語和其他語言都有不同尋常的鼻輔音:前爆鼻音(preploded nasals),在詞尾會聽到鼻輔音/-pm/,/-tn/和/-k?/,和后爆鼻音(postploded nasal)/-mb-/,/-nd-/,或/-?g-/,元音間的鼻輔音后跟塞音,但是塞音持續時間太短,幾乎聽不見。
在臺灣島中部的一些語言,加里曼西北的大量語言,東南亞大陸的占語,小巽他群島的幾種語言里都發現了先喉塞音(preglottalized)或內爆音。在斐濟語和美拉尼西亞語的許多其他語言里,濁塞音b,d,g自動前加鼻音,即mb,nd,?g。南島語最不常見的輔音類型是前鼻雙唇顫音(prenasalized bi-labial trills),即,在m后顫抖嘴唇,通過上唇接觸舌尖產生舌尖唇塞音(鼻音和擦音)。前者在美拉尼西亞西部金鐘群島的馬努斯島(Manus)語言里很常見,后者散見于瓦努阿圖中部的大量語言里。
聲域聲調
東南亞大陸的許多南島語區分兩種聲域(voice register):呼吸音或陰森音(breathy或sepulchral)(放松聲帶),和清音(clear voice)(收緊聲帶)。由于幾代人雙語,大多數占語都有了這個特征。當他們進一步接觸到有聲調的語言時,如占語(越南語)或回輝語(Tsat)(海南島的漢語和壯侗聲調語),至少有兩種占語已基本上變為有聲調的單音節語言。聲調對立也廣泛出現在新幾內亞島的兩個地區和新喀里多尼亞南部的一些南島語里。盡管臺灣土著語言長期與漢語接觸,并且這種接觸可追溯到至少三個世紀之前,但是臺灣土著語言沒有產生聲調。菲律賓的許多語言使用重音來區分單詞,如他加祿語sábat“設計編織成布或席”,sabát“止動銷或泥料”。有些菲律賓外的語言使用重音對比區分同一個詞的不同形式,如蘇門答臘島北部托巴·巴塔克語(Toba Batak)gógo“死勁推”,gogó“強”或者díla“舌頭”,dilá“一個健談的人”。重音對比的起源和歷史仍是南島語研究中尚未解決的主要問題之一。
語系關系
Humboldt(1836-1839)、Bopp(1841)等認為所有南島語都是印歐語系印度-伊朗語支印地語分支的成員。Schmidt在他的著作《孟高棉人》第四章表示,南亞語系和南島語系一起構成一個更大的語系——南方大語系(Austric)。Macdonald(1907)提出南島-閃語系假說,他的假說僅僅根據地理分布。Rivet(1925)認為美拉-波利尼西亞語和霍坎語有共同歷史來源。Labberton(1924)認為南島語(稱為“馬來-波利尼西亞語”)與日語存在發生學關系。Kawamoto從1977年開始也證明日語與南島語言同源,Benedict(1990)把他1942年的澳泰語系假說(1942年的分類包括卡岱語、南島語、南亞語和苗瑤語,他從1967年到1975年發表了一系列文章證明澳泰語系假說,并提出了上百個新詞源和原始形式)加以擴展,把日語囊括其中。Sagart從1990年開始,不斷撰文證明漢藏語和南島語同源,并最終擴展為包括南亞語、南島語、苗瑤語、漢藏語的東亞超級語系(Sagart 1990,2005)。此說得到中國學者邢公畹的支持。美國學者Blevins(2007)提出尼科巴群島的加拉瓦語和昂格語構成一個“翁干”語系,為南島語的姊妹語,二者構成“翁干-南島”超級語系。
南島語與壯侗語
1988年,倪大白認為從南島語(以印尼語為代表)到壯侗語,雖經歷了從多音節到單音節、從無聲調到有聲調的重大變化,但壯侗語同源詞的基本面貌仍源自南島語。1992年鄧曉華的研究表明壯侗語與南島語確實存在同源關系,證據是二者都有一批反映原南島人文化的底層詞,這些詞屬于日常生活基本詞匯,借用的可能性很小。
南島語與泰語
1942年,本尼迪克特(Paul Bennedict)研究發現南島語與泰語(壯侗語,Tai)、加岱語(Kadai)存在同源關系,后來他將南島、壯侗、加岱甚至苗瑤語統一歸類為澳泰語系(Austro-Tai)。他認為在400多個作為例證的詞根中,許多詞根的系統語音對應關系已經明確。他還構擬了澳泰語的一些基本詞匯,如水田、米、甘蔗、水牛等。因此,他認為“如果我們承認這三個語系(指壯侗、加岱、印尼語)在發生學上有聯系,我們必須把它們分散的中心定在中國南部地區的某些地方”,“操原始印尼語的人民是從中國南部海岸,也許經過海南島往北遷移到臺灣,往東遷移到菲律賓,往南遷移到越南、加里曼丹島、爪哇、蘇門答臘島和馬來半島”。
南島語與漢語
20世紀90年代,漢語與南島語的關系開始被學界重視。沙加爾(Laurent Sagart)最早提出漢(語)南(島語)同源說,他認為漢語與南島語之間具有成型的語音對應規律,非常相似的中綴變化,包括封閉性詞類和一般的基本詞匯的詞匯對照,表明二者之間很大可能存在發生學關系。語音對應方面,漢語的單音節詞與南島語多音節詞的最后一個音節對應;中綴變化方面,古漢語中綴-j-、-r-分別與南島語中綴-in-、-ar-對應,例如,在古漢語中當詞根是動詞,插入-j-可表示承受者,或動作的工具、手段,而南島語中-in-亦有類似的作用。沙加爾認為漢語-南島語發源于距今8000-7000年前的黃河中游地區,當地已經開始種植水稻、小米,并有鑿齒等習俗。薩加爾甫一提出漢-南同源學說,中國學者就給出了較為正面的回應。邢公畹認為:“從我能同意的例子看,就足以說明漢語與南島語是從一個共同祖語——原始漢澳語(Proto-Sino-Austronesian)衍生下來的。”鄧曉華也發現一批閩、客(家)漢語方言與南島語的同源詞,并認為這反映了南方漢語中有不少古南島語的成分。
南島語與日語朝鮮語
地處東北亞且語言系屬關系不明的日語、朝鮮語與廣泛散布于西太平洋海域諸島的南島語族有零星的共同語言特征。如南島語中有和日語、朝鮮語同為SOV語序的莫圖語;日語的開音節結構和高低型音調與南島語中的波利尼西亞語以及印尼語類似;松本信廣曾列舉出130個日語和南島語的同源詞;吳安其認為朝鮮語中有更多體現南島語特征的基本成分,從語音、詞匯、語法各方面列舉了朝鮮語與中國臺灣少數民族語、印度尼西亞語、他加祿語、湯加語、夏威夷語、毛利語等南島語諸語言之間的對應關系。
相關研究
中國研究現狀
中國對南島語的研究,可上溯到20世紀50年代。進入21世紀以來,中國南島語研究成果主要表現在:
1.利用歷史比較語言學或結合考古人類學、分子人類學方法來驗證南島民族起源假說,在探討南島語系與漢藏語系、南亞語系的關系,以及確定回輝話的性質等方面,都有一定程度的突破。
2.中國南島語的語言結構描寫研究一直持續推進,從語音、詞匯、語法等方面描寫各語言基本面貌的論文、專著持續問世,并在相關領域都取得不同程度的進展。此外,碩士、博士學位論文選取南島語為研究對象的比重有所增加,選題從語音、詞匯、語法到語義、語用均有涉獵。方言、詞典編纂、語料庫、書寫符號系統研究起步稍晚,但也有了零的突破。
3.中國南島語學者通過田野調查,依據具體語言事實,運用優選理論、制圖理論等理論和方法,對語音方面如滑音的形成機制與音韻模式、韻尾輔音、元音增刪、詞重音和語調、回輝話聲調形成的機制,以及共時音變規律與歷時語音演變規律;詞匯方面如詞類、一般詞匯及詞匯的語義、語用等;語法方面如派生構詞法、重疊構詞法、焦點系統、短語結構、語序、句法成分與句類等問題,取得了豐富的研究成果。
研究方向
起源爭議
他主要運用構擬的動植物群的古語材料來推斷南島語的起源地,尤其是只在某種特定氣候條件下才能找到的動植物群。1889年他在《馬來玻利尼西亞人群起源地的語言學證據》一文中,比較了遍布各地區的一百種南島語言,并構擬出一些原始南島語詞匯。如從稻、米、旱田、水牛、鱷魚、黑毛猴等詞匯的分布區域來看,古南島語的起源地指向中南半島沿海一帶。日本學者土田滋與克萊因的看法比較一致,并從“穿山甲”一詞的分布地域更進一步證實了克萊因的看法。
中國大陸華南起源說
最早提出者是美國學者白保羅。他于1942年發表《臺語、加岱語和印度尼西亞語-東南亞的一個新聯盟》,首次將南島語與侗臺語進行比較,列出了近30個南島、侗臺語同源詞,論述了南島語與侗臺語的同源關系,并結合民族學、考古學證據證明它們共同起源地在中國的華南地區。法國學者奧德里古爾也持相同觀點,他認為南島語的起源地應該在亞洲大陸東南沿海一帶,介于海南島和臺灣島之間。
戴恩的觀點
戴恩在1965年的《南島語言的詞匯統計分類》一文中,運用語言分布與民族遷徙學說來推測南島語的起源問題。由于東新幾內亞島與美拉尼西亞的語言屬于東部南島語大洋洲支系的一支,它們有一些共同的語言演變。那么南島語言最分歧的地區也就只有新幾內亞西部及其附近,因此這一地區最有可能是古南島語的起源地。
貝爾伍德的觀點
他提出了南島語在太平洋島嶼上的遷徙與擴散路徑,即“Express-Train”(快車)模型。簡單來說,快車模型認為南島語起源于臺灣島,從臺灣島開始,經菲律賓、印度尼西亞東部,而后快速向玻利尼西亞擴散。格雷、德拉蒙德和格林希爾基于統計推斷系統發育譜系樹的托馬斯·貝葉斯法,認為南島語大約距今5200年前起源于臺灣島,并在一系列的定居停留和對外擴張中迅速穿越太平洋。李壬癸也贊同這個說法,他根據愛德華·薩皮爾的觀點,認為語言最歧異的地區就有可能是該語族的發源地,也是語族擴展的中心。他發現,臺灣島的語言最紛歧,語言之間的差異最大,因此,臺灣島可能是南島語的起源地。
與其他語言也有發生學關系
有學者認為南島語系與其他語言也有發生學關系,構成一個超級語系,主要有四種。
白保羅的澳泰語系假說
他根據傳統的比較法把南島語和東南亞大陸內部的壯侗語聯系起來,得到許家平(Weera Ostapirat)、布倫奇和沙加爾等人的支持。許家平假定了一系列的規則對應把這兩個語系聯系起來,南島語是第一個從這個語系里分裂出來,而說壯侗語的人留在他們的故鄉中國大陸。布倫奇認為,如果它們之間的關系是真的,那么它們的關系就不可能只是姊妹語。他認為原始壯侗語人群是遷徙到海南島后又從菲律賓北部返回大陸的,他們的獨特性源于與宏勉語和漢語接觸之后的結果。后來白保羅又擴展了該語系,把日語也加進去了。
南方大語系(Austric)假說
有學者認為南亞語系和南島語系應該存在發生學關系,但是二者更有可能是類型學關系。雖然如此,從形態證據來看,尼克巴語言和菲律賓的南島語言之間存在著聯系。白樂思支持把長江下游新石器時代澳泰語文化與水稻種植的南亞文化聯系起來的假說,并且假定東亞水稻馴化的中心和推測的南方大語系的故鄉都在中國云南與緬甸交界地帶。根據這一觀點,東亞南部地區基于水稻種植的人口擴張,出現了東西向的基因排列:南亞-壯侗一南島,與之毫無關系的漢藏語系占據了更北的一層。
漢-南島語系假說
法國語言學家、漢學家沙加爾認為南島語系與漢藏語系同源,并且認為壯侗語與馬來一玻利尼西亞語關系更緊密。基于基本詞匯和形態相似性中的語音對應關系,他認為,漢語和南島語之間存在南北同源關系。沙加爾得出結論,臺灣島南島語有兩種玉蜀黍屬(而不僅僅是以前認為的狗尾草),把前南島人定位于中國東北,與漢藏語可能的故鄉相鄰。5科奧等人的基因研究可能證明沙加爾的結論是正確的,他們指出南島人的mtDNA單倍型群和漢藏族的M9a單倍型群顯示二者是姊妹語,這個至少表明早期南島人和漢藏人母系基因庫之間存在著密切的聯系。除此之外,魏等人的研究結果也與沙加爾的一致,他們的研究表明說南島語的人的Y-DNA單倍型群03a2b *- P164(xM134)屬于一個新定義的單倍型群03a2b2-N6,它廣泛分布在從韓國到越南的亞洲東部沿海地區。沙加爾還以類似遞歸的方式給南島語言分組,把壯侗語當作馬來一玻利尼西亞的姊妹語。但是同行們發現他的方法論是假的。
日-南島語系
白保羅、川本三郎、米勒等人都認為日語與南島語有發生學關系。其他語言學家則認為二者沒有發生學關系,只是受到南島語底層的影響。提出這個假說的人認為南島語系曾經覆蓋整個島嶼,由南到北。羅貝茲認為日語應該屬于跨歐亞語系(“Transeurasian”,即超級阿爾泰語系),但是受到了準南島語(“para-Austronesian”原始南島語的姊妹語)的詞匯影響。語言學家庫馬爾認為一些南島人可能遷徙到日本,可能是來自爪哇的精英團體,然后創建了日本等級社會。她也識別了82個日語和南島語可能的同源詞,然而她的理論仍有很大爭議。
翁干-南島語系
布萊文斯假定南島語和原始翁干語都是原始南島-翁干語的子語,但是主流語言學家都不認可,這個假說仍有很大爭議。白樂思認為這個假說非常牽強,因其僅依靠偶然相似和有漏洞的方法論。
除此之外還有日-澳泰語系假說、南島印歐語系假說、南島-閃語系假說、南島-美洲印第安語系假說。白樂思認為這些假說沒有一種是有說服力的。李壬癸的態度稍有不同,他認為南方大語系假說最令人期待,因為它有兩個重要的形態證據,南島語和南亞語都有中綴-um-和-in-,并且有相似的功能,當它們同時出現時有著同樣的順序。與詞匯、語音和句法相比,形態是最穩定的,不易變化的。而南島一印歐語系假說、南島一閃語系假說、南島一美洲印第安語系假說、翁干一南島語系假說都沒有強有力的證據支撐。
古南島語的分化
南島語民族廣泛分布在太平洋和印度洋的島嶼和半島上,多數學者推測他們大約7000年前來自中國大陸東南沿海一帶,其原始居留地可能包括臺灣。南島民族要擴散到如此廣大的海域,且在移民之后又能在島嶼之間保持一些來往,學者認為南島民族必須擁有優良的航海技能和舟船工具,因此在古南島語中應存在豐富的航海與舟船詞匯。這種推測在東部的密克羅尼西亞和西部的印尼語、馬來語和菲律賓的南島語得到了印證。然而,據土田滋、達爾、白樂思、戴恩等學者的研究,在臺灣地區的南島語中未見古南島語舟船同源詞。但李壬癸的《臺灣南島語的舟船同源詞》一文,根據泰雅語、賽德克語、鄒語、卡那卡那富語、沙阿魯阿語、布農語、排灣語、卑南語、賽夏語、阿美語中普遍表示“漂流、被水沖走”的詞形,構擬了古南島語的“漂流”等相關詞匯,證明臺灣南島語言中確實有關于航海和舟船的同源詞,只不過由于臺灣地區的南島語較早失去舟船文化,導致舟船同源詞數量遠少于其他地區。
方言研究
臺灣南島語方言種類眾多,泰雅語有澤敖列和賽考利克兩個方言;賽德克語原分霧社、春陽、太魯閣國家公園三個方言,后太魯閣方言從賽德克語中分出,升格為太魯閣語;阿美語原先分撒奇萊雅方言、北部方言(南勢阿美)、太巴塑-馬太安方言(秀姑巒阿美的太巴塑、馬太安部落)、中部方言(海岸阿美和秀姑巒阿美)、南部方言(馬蘭阿美和恒春阿美),后撒奇萊雅方言從阿美語中分出,升格為撒奇萊雅語;布農語有三個方言:北部方言(卓社群、卡社群)、中部方言(巒社群、丹社群)和南部方言(郡社群);賽夏語分南部方言(東河方言)和北部方言(大隘方言);排灣語分東南部方言(含太麻里、獅子、來義、土坂四個土語)和西北部方言(含三地、筏灣兩個土語);魯凱語有茂林、萬山、多納、霧臺、大武和大南等方言;鄒語分久美、特富野、達邦三個方言;達悟語有四個方言:紅頭(紅頭、漁人社)、椰油、東清(東清、野銀社)、朗島方言。
參考資料 >
講座紀要 | 鄧振華:多學科視野下的南島語族起源與擴散.北京大學考古文博學院.2025-09-30
淺談世界語言譜系.北京語言文字工作協會.2025-09-30
南島語系.中國大百科全書.2025-10-01
杜樹海,郭健新 | 南島語族的起源與擴散:成果、爭論與新的解釋.微信公眾平臺.2024-06-08
南島語族起源與中國東南沿海考古.澎湃新聞.2025-09-30
來平潭尋南島語族之根:起底人類史上一次神秘的遷徙之旅.百家號.2025-09-30
波利尼西亞語族 概述.中國民族文化資源庫.2025-10-01
美拉尼西亞語族.中國大百科全書.2025-10-01
密克羅尼西亞語族.中國大百科全書.2025-10-01
多學科協作揭示史前人群交流——以亞洲東部沿海地帶為例.中國社會科學網.2024-06-09