羌語群 | ● 爾瑪語組 ● 嘉絨語組 ● 南部語組 ● 附:納西語 |
---|---|
共 42 語 言 |
附:羌樹印象 | 羌語群(羌語支)由孫宏開奠基,今包括爾瑪語(羌語)、嘉絨語、拉塢戎語(賴雲帆稱之綽斯甲語)、爾龔語(霍爾語、道孚話)、扎巴語、卻域語、貴瓊語(顧羌語)、木雅語、普米語、史興語、爾蘇語、里汝語(呂蘇語)、多續語、納木依語14種。 羌語群是一片分歧很大的語言,小站測算它的內部差異是6000年(2024年5月以前是5200年),比通常認為的大,它不是一個譜系群,是一個地理群。 也有學者認為納西語和羌語群有關係(羌-納語),這裡也附上納西語。納西語只和納木依語、普米語相對較近些,和羌語群其他語言都非常遙遠。類比的話,納西語是裙子,羌語群是衣服,前者只和連衣裙有點像。 一、羌語群的10個簇從統計的34個數據看,羌語群有10個穩定的簇: ①爾瑪語(羌語):不管怎麼調整,爾瑪語都獨立一簇,不和其他語言相混。爾瑪語的縱深(即內部的最大差異)約2500年,這是共祖時間,這個祖先往上很久,才能找到旁系親屬。南部爾瑪語漢借詞較多,在詞表中會和其他漢借詞較多的語言產生對應,據此可以判別其他語言中漢借詞的規模。爾瑪語和爾蘇語是羌語群中離主體最遠的兩個語言,它倆應位於關係樹的最外側。 ②東部嘉絨語:東部嘉絨語(四土嘉絨語)縱深約1000+年,雖然接受了一些漢語的影響,但仍然是一個個性鮮明的語言集團,和其他羌語群語言界限分明。 ③西部嘉絨語:西部嘉絨語(含爾龔語、道孚話)縱深約1500+年,分歧比東部嘉絨語稍大,它和南部語組有稍多對應詞,常能和卻域語、扎巴語等聚成一簇,然後才和東部嘉絨語聚簇,康定木雅語、貴瓊語有時也能聚在西部嘉絨語的旁邊(以上這些都是藏文化圈語言),這些南部語組語言從不和東部嘉絨語聚類。 (關於拉塢戎語和北部嘉絨語的地位:嘉絨語原本是個地理連續體,經歷漫長演化,方言斷裂,後各地高速發展,拉大分歧,至今「東部-(拉塢戎語/日部/草登)-西部」仍然漸變,兩頭的極端差異約4000年,相鄰「-」號間差異2000-3000年,拉塢戎語/日部/草登三者間的兩兩差異也達到2000-3000年。從歷史縱深關係看,嘉絨語是一個兩頭小、中間大的橄欖形,而且拉塢戎語是一種典型的北部嘉絨語,它和日部、草登等北部語言構成橄欖的中間部分,拉塢戎語/日部/草登的歷史地位沒有明顯區別,雖然它們之間的語言差異是巨大的。關係樹不善於表達語言的地理漸變,圖中用虛線示意,它不表示語言的影響和侵犯,只表示最自然的語言漸變發展。) ④扎巴語:孤獨語言,最接近的語言是西部嘉絨語,時間距離約3000年。 ⑤卻域語:孤獨語言,最接近的語言也是西部嘉絨語,時間距離約3000年,扎巴語、卻域語間一點也不親。 ⑥木雅語:語保工程的兩個木雅語差距很大,兩者相距約2500-3000年,康定木雅語和西部嘉絨語對應詞較多,雅安木雅語卻很少,可能是藏語借詞影響,雅安木雅語和所有語言都相距甚遠,非常獨立,可能是個尚未正確識別的語言。 ⑦貴瓊語:孤獨語言,和任何語言都很較遠,只和西部嘉絨語、南部羌語有一些的對應詞(漢借詞導致)。 ⑧普米語、史興語:這兩個語言有一些但不太多的對應詞,雖然遙遠,但可以為一簇,它們和其他語言也都非常遙遠,但和納西語有一些對應詞。 ⑨爾蘇語、里汝語、多續語:其中爾蘇、里汝關係較近,多續和它倆較遠,但三者都有可觀的對應詞,可為一簇。爾蘇語是羌語群裡最遠的語言,和主體語言的對應詞最少。 ⑩納木依語:孤獨語言,和誰也不親,和納西語、普米語對應詞最多些,關係相對較近。 這10個簇,依據古音小鏡的時間測算,在距今3000年並行,認為它們在西周早期時已存在。 二、上層結構 10個簇之上是什麼結構呢?這是個很難的問題。孫宏開《古代羌人和現代羌語群族群的關係》畫有譜系(南北兩系),金理新《戎語支的創新和劃分》中有用語音創新為羌語群語言所作的分類,馬普所的 祖1:①爾瑪語(羌語) 祖2:②③④⑤⑥⑦東部嘉絨語、西部嘉絨語、扎巴語、卻域語、木雅語、貴瓊語 祖3:⑨⑩爾蘇語、里汝語、多續語、納木依語(⑧普米語、史興語較難確定,暫附於該組) 判斷的干擾因素是羌語群語言或多或少接受了藏語的影響,使其在表面上趨向一致。用程序和藏語比較,各語言藏借詞規模如下: 藏借詞發達水平的:卻域語、扎巴語、康定木雅語、貴瓊語、普米語、所有西部嘉絨語。 藏借詞中等水平的:史興語、所有東部和北部嘉絨語(東部的稍少些)。 藏借詞較低水平的:除龍溪話的爾瑪語(羌語)、里汝語、納木依語。 藏借詞最少的:雅安木雅語、爾蘇語、多繼語、爾瑪語(羌語)的龍溪話。 因此,祖2成員之間的實際差異可能要比關係樹更大一些。 這3個祖先,依據古音小鏡的時間測算,在距今4500年時並行,認為它們早於夏代。 三、歷史縱深以下是近年來新發譜系樹中羌語群內部最大差異: 2019年張夢翰漢藏語樹:2050年(收有12個羌語群語言) 2019年沙加爾漢藏語樹:3200年(收有6個羌語群語言) 2020年ZhangHanzhi漢藏語樹:2200年(收有12個羌語群語言) 以上三棵樹都是優秀的,但都小於古音小鏡測算的6000年(依據見頁腳「附1」)。 原因是: ① 體例所限,三大樹面向漢藏語系,未能顧及羌語群全部重要語言,這是正常的。 ② 三大樹依據核心詞彙,古音小鏡依據語音對應,觀察角度不同。 詞彙差異,除了時間因素,還有地理因素。 同時分化出的語言:A-B-C-D-E-F,經過若干年後,地理兩端A-F的詞彙差異最大,臨近的最小,因為詞彙是靠交流引力維持的。羌語群長期在四川西部很小的區域內共存發展,是地理臨近語言,導致詞彙分歧測算的分化時間偏晚。 語音分歧測算的分化時間,也會受地理遠近的干擾,但干擾比詞彙弱,它相對更接近真實分化時間。 (證據見小站漢語地理的「詞彙距離」和「語音距離」兩個網頁中吳語和徽語的比較)。 6000年,接近藏緬語的極端尺度,這是否合理? 合理的。 羌語群是一個地理縮小版的藏緬語,當您查詢數詞123456789時,會發現,在藏緬語裡出現的豐富語音形式,大多也會出現在羌語群中,它的內部分歧可以和整個藏緬語媲美。 羌語群以外的藏緬語,是個大王國,羌語群自成一個小王國,兩個王國有相同的歷史縱深。如果體現在漢藏語譜系樹上,羌語群要分成羌A、羌B、羌C……分別和其他漢藏語族/語支並列。 羌語群是南島語裡的台灣、漢語裡的閩語。
四、納西語和羌語群納西語是一種孤獨語言,它和所有漢藏語言都很遠,包括緬彝語、白語、藏語、羌語群,如果非要找一個最近的,那麼就是納木依語。 依據小站的時間標準,納西語-納木依語相距約3000年(其實也不近,但最接近納西語的漢藏語只有它了)。 孫宏開已把納木依語放在了羌語群中,這樣就會有「納西語算不算羌語群?」的疑問。 已知納木依語不是羌語群的根分枝,而是內部的一個小分枝,如果納西語進來,會聚到最親的納木依語的旁邊,即成為羌語群的內枝語言、下位語言。 以上是直接理解。 從深處看,納西語和羌語群成員的最小差異,小於羌語群內部成員的最大差異,這是納西語位於下位的實質原因。 很多人會把納西語-羌語群並列放置,這是不恰當的。 從更深處看,內部縱深左右領屬關係,羌語群內部縱深6000年(先姑且信它),納西語內部縱深1500年,而兩者最近距離是3000年,我們可以想象,它倆像2個氣球,內部縱深相當於半徑,距離相當於球心距,那麼易知:小球必在大球內,兩者是包含關係。 用生物類比的話,羌語群相當於「有脊椎動物門」,納西語相當於「貓科」,它倆地位無法並列。 羌語群的「門」特別大,不僅能關住納西語,把緬彝語支拉進來,也是它的下位、內枝(已驗)。原因都是:羌語群不是譜係群,是地理群。 圖中,納西語和納木依語並列後和普米語聚類,因普米語是羌語群中和納西語第二親的語言。 總之,納西語和羌語群是很遠的。如果要合併,是羌語群的內枝語言,不是並列語言;如果要拆分,可把納木依語拆給納西語,建立一個雙納語支;或認為納木依語是混合語,這是下策。納西語和另一個大語支緬彝語的關係見「尼語素」網頁。 五、羌語群人群的歷史推測觀察羌語群語言的地理差異,是一種完美的自然演化狀態,語言差異和地理遠近、山川河谷吻合。 差異最大的兩個語言:爾瑪語在最北、爾蘇語在最南。西部嘉絨語和南部語組地理近,語言也近,東部嘉絨語和南部語組地理遠,語言也遠。 可推測,羌語群語言是一次性進入這片地區後緩慢分化形成的。 三個證據可幫助探索羌語群人群的歷史:①上面預測的祖語年代、②南邊摩梭人的母系文化、③羌語群普遍的部落文化而非國家文化,這些都指向遙遠的年代。 多樣性分佈方面,羌語群在各個方向都有很強的多樣性。 北部的爾瑪語、嘉絨語相鄰,它們隔開4000-5000年,是一個大斷層。 南部語組各語言之間,近的隔開約3000年,遠的也隔開約4000年,南北最大差距約6000年。 羌語群在地理多樣性上,內部無法提供人群的遷徙、移動信息。 相對合理的推測如下:「這群語言在距今5000-6000年間的某個時間裡,一次性進入這片地區,並迅速擴散開,後世雖有小規模調整,但沒有經歷太大的擾動」。 羌語群人群的歷史遠於文獻時代很多,不適合用秦漢以後的文獻去編織他們的歷史。另羌語群古代有掠奴傳統,基因可能多樣,若用基因學研究應考慮這個因素。 附1:時間定位依據依據主要有兩個: ① 羌語群內部最大差異,接近羌語群-景頗/獨龍的差異,即接近藏緬語內部極端差異。 羌語群內部,爾瑪語(羌語)、爾蘇語、東部嘉絨語兩兩之間的語音對應率在5%-10%之間,它們和景頗/獨龍的語音對應率也在5-10%之間,語音分歧屬於接近水平,因此推測它們分化時間接近。 (語音對應率指詞表中每百音節找到語音對應的比例,詳見「羌語群對應詞表」)。 ② 從可通話程度輔助判斷。 小站的語言時間以「千年為不能通話臨界」做輔助判斷,「不能通話」指在竭盡全力的情況下仍然無法交流,羌語群取兩證一驗。 「兩證」是「南部爾瑪語五個土語不能通話」和「東部嘉絨語內部可以通話」(分別是《羌語簡志》和林向榮《嘉絨語研究》的說法),實際情況在上圖中有矛盾,若以爾瑪語考慮,現有節點應左移,若以東部嘉絨語考慮,現有節點應右移,現讓兩者夾逼1000年界限,這樣兼顧了2個證據,這對矛盾派上了用場。 「一驗」是納西語,已知西部納西語之間可通暢交流,和東部納西語(摩梭語)不能通話,樹中前者在1000年以內,後者在1000年以外。 這三組語言落定後,關係樹延伸到很遠的地方,根部落在距今約6000年的地方(2024年5月以前是5200年)。 可通話性用來預測羌語群這樣深度的語言,精度已經不高,越遠誤差越大,遠處時間只作為大致參考。 ①是主要依據、②是輔助依據。 附2:樹的不穩定性「羌語群關係樹」綜合考慮了幾種篩閾值下的結果,觀察遠距離語言時會把篩閾值放低一些,網眼放大,進來的魚會多一些。 遙遠語言的關係樹,早期分支關係多不穩定,數據調整或者建樹方法的不同,都可能影響到樹形,該樹形是在測試中最常出現的樹形,但我仍不能確保早期分支關係的可靠性,圖中早於4000年的分支都是有討論餘地的,更好的信息是母數據「羌語群對應詞表」。 站長 2024-3-2(2024-5-25、6-16有修改) |
---|
附:關係樹原理 | |
---|---|
樹的原理 |
語音年輪:語音對應越弱 => 分化時間越長
樹形由「對應詞表」決定,樹齡由古音小鏡推定。對應詞表(見另一個網頁)是程序找出的音節對應比例(例如:兩語言詞表,相同義項上各存在5000個不去重音節,程序發現有2500個音節存在語音對應,那麼比例是50%),即語音對應的強弱。數值越小,分化時間越長,數值越大,分化時間越短,以此形成樹形。 語音對應須同時滿足2個條件: ① 音類實際接觸須大於隨機概率。 ② 音類實際接觸較隨機概率的富餘須大於後者的不確定程度(滿足信噪比要求 詳見此)。 |
特點 |
回歸語言學傳統:語音對應 ✿ 不採用斯瓦迪士詞 採用全部詞 ✔ ✿ 不採用編輯距離 採用概率對應 ✔ ✿ 不採用人工找詞 採用整張詞表 ✔ |
局限 |
不區分固有詞和借詞,反映語言的綜合差異。 時間-數據的映射曲率尚未嚴格論證。 語素未經人工確認和標註,結論是初步的。 |
方法論差異 | 古音小鏡關係樹依據語音年輪,和詞彙年代學的結論相比,有的相同,有的不同,有的差異小,有的差異大。這是從兩個角度觀察事物,不是替代關係。古音小鏡保持探索方式的自由,不受已有見解約束,使結論具有獨立性。 |