回覆列表
  • 1 # 一米八五吃不胖

    一、語言的本質

    語言的存在最初乃至現在是為了什麼?是偷偷寫情書時搜腸刮肚的遣詞造句還是掛在牆上附庸風雅的書法作品?人類始祖在創造語言的時候一定沒有想到後代們的風花雪月,對於人類彼時首先需要解決的問題只有一個,生存,更好地生存。人類簡單的思想膨脹到不得不表達出來的時候,語言就產生了。這種實用主義的產物決定了語言的本質,即語言是思維的附庸,是服務於思維和交流的工具。

    確立了語言作為工具這一本質屬性之後,似乎評判標準逐漸明晰起來,一種工具是否好用是很容易判斷的,但是似乎又很難判斷。如果你堅持認為瑞士軍刀比王麻子菜刀好使,請問剁排骨呢?如果你覺得Photoshop一定比自帶畫圖好用,那麼僅僅是新增一行文字呢?可見,看起來高大上的工具不一定就是最好的,儘管它多功能、高效能長得又好看,決定一種工具的好壞取決於應用需求而不是工具本身。

    人類對語言的應用需求是什麼?能否準確、及時、高效地傳遞資訊。傳遞資訊的工具除了人類的語言還有很多類似的東西,比較有意思的一種就是光纖。光纖效能的高低取決於其傳輸準確率、傳輸速度和抗干擾能力等指標。

    世界上各族群的語言可以說千姿百態,但是思想卻是驚人地相似,尤其是一個人在異鄉深入當地人生活並良好掌握當地語言之後就會發現:世界是一樣的。可能東方人喜歡婉約西方人喜歡大方,不變的都是愛美;東方人迂迴西方人直接,追求的都是利益。既如此,表達思想的語言如何將相對一致的思想高效表達出來就成了語言好壞的評判指標之一。這裡涉及到一個高大上的名詞——“熵”。

    用大白話說就是同樣的時間長度、同樣的音節數量,哪種語言傳達的資訊更多。語言像一列列火車一樣承載著思想行駛,不同的是有的是動車組,有的是綠皮車,有的是沒有門的印度火車。當一種語言資訊負載量越高,我們說這種語言的“熵”高,從資訊傳遞效率的角度,這就是一種比較好的語言。

    法國做過一項比較有名的實驗,選取若干種語言,令受試者用自己的母語朗讀20段意思相同的文字並進行錄音,統計朗讀中的音節數量和義項數量,二者的比值作為資訊密度數值。實驗得出的結果是:漢語資訊密度最高,達到0.94;英語0.91緊隨其後;德語0.79;最低的是日語的0.49,跟漢語相差近一倍!

    現代漢語大多數詞彙是雙音節詞彙,綜合多音節詞和單音節詞,現代漢語詞彙的平均字數是1.5,由於漢字一個字基本是一個音節,所以現代漢語詞彙平均音節數量也基本是1.5.用1.5個音節表達一個意義跟別的語言相比似乎並沒有太大優勢,因為英語中也有很多雙音節甚至單音節詞。但是這是理論而言,實際上,英語的單音節詞或者雙音節詞的實際發音平均要長於漢語的音節,漢語音節多為“子音+母音”、“子音+母音+子音”、“母音”等結構,而英語、德語、阿拉伯語等存在大量的雙子音連用甚至子音群的出現,大大增加了音節的發音時長,使得其在單位時間內所發出的音節數量低於漢語。這就造成兩種現象,同樣一段話,要麼是漢語先說完,要麼是漢語能比其他語言更“從容”地完成朗讀。

    從音節資訊負載量上來看,漢語勝出英語、日語等。

    二、更長還是更粗

    這個小標題太黃了,但是在語言對比方面是有絕對參考價值的。語言學界對語言的最粗劃分可分為綜合語與分析語。所謂綜合語是指透過語言內部本身的詞形變化、句法手段等的使用來表達意義的語言,又可細分為屈折語和黏著語,前者如法語、英語,後者如土耳其語、日語(或許不是)。分析語是相對缺乏形態變化而需要依賴說話人言語外訊號和具體語境而決定意義的語言,最具代表性的就是我大漢語。

    同樣的思想傳遞,不同的語言選擇了不同的模式。對不同模式的高下之爭個人感覺有點像RGB模式和CMYK模式的辯論,這不是取決於你要在顯示器觀看還是需要列印嗎?在這一點上我會選擇做一個沒有個性的理中客,分析語和綜合語各有千秋,難分高下。

    來看幾個例子

    漢語 土耳其語

    吃 yemek

    我吃 yiyorum

    我們吃 yiyoruz

    我們不吃 yemiyoruz

    這裡最顯著的一個區別是,當漢語從一個詞增加到三個詞,土耳其語仍然是一個詞。漢語會使用不同的詞組合成為新的短語和句子,土耳其語僅僅需要在詞的內部進行某種變化就可以達到相同的效果,產生的結果就是分析語堆疊許多單片語成的句子,黏著語可能就只有一個詞。顯然,黏著語選擇了改變詞內部的形態而增加單詞長度的方式來表達意義,分析語則需要羅列出義項相對應的詞進行組合。

    再來

    漢語 俄語

    我 ya

    你 ty

    愛 ljubit’

    我愛你 ljublju tebya

    你愛我 ljubish menya

    我愛過你 ya tebya ljubil

    這裡面,“我愛你”、“你愛我”有完整的表達方式,為了凸顯屈折語的特徵,省略主語“我”和“你”,完全不會產生歧義。這是因為屈折語的重要語法手段之一就是詞形變化,動詞會變位以區別人稱和主客體,時態變化以區別時間,名詞有性、數、格的變化。當屈折語中的動詞和名詞變化完成之後,正說反說倒立說,意思都不會有所變化,甚至省略掉某些成分之後意義仍然明晰。而分析語則不可以倒立說,必須規規矩矩按照順序來講才能保證意義不變。在意義的表達上,屈折語和分析語就走上了兩條完全不同的道路,選擇了兩種不同的語法手段:屈折和語序、虛詞。如果想豪放地不管順序,則需要考慮詞形變化;如果嫌詞形變化太麻煩,則需要在語序和虛詞上斟酌。又達成了一對平衡。

    還沒完

    漢語 英語

    媽 麻 馬 罵 mum flax horse rebuke

    湯 糖 躺 燙 soup sugar lie hot

    婊 婊—— beach bitch

    大家都看出來了,要開始說聲調了。聲調並不是分析語共有的,而是漢藏語系的一種語音特徵,據說葡萄牙語也有聲調,即使有,大部分印歐語系也都不屬於聲調語言。從上面的例子可以看出,現代漢語的四個聲調被分配給同樣的音節,所產生的意義是各不相同的,而給英語的音節賦以任何聲調,其意義都不會發生變化(少部分區別重音的單詞除外,record)。

    漢語聲母21個,韻母39個,實際存在的音節數約為400餘個。英語的實際音節數理論上可以達到很多,因為存在子音群,實際實用的音節數也遠遠多於漢語,這是因為英語沒有聲調,不得不在音節的長度上增加以適應實際使用的需要。而漢語將每個音節賦予聲調,就可以採用較少的音節數表達同樣的意義,提高了音節的利用率並減輕了記憶負擔。如果說非聲調語言在音節上是線性展開,是一維的,那麼聲調語言就會在每個音節的基礎上增加聲調這一非音質屬性,是二維的。非聲調語言是透過增加其音節長度實現意義區隔,聲調語言透過拓展音節寬度實現。

    順便說一下,漢字和音素文字的區別也在這裡,音素文字是一維線性展開的文字,漢字是二維延展的文字,漢字的資訊負載量高於線性文字。漢字跟漢語還真是天生的好基友呢。這也就解釋了“聯合國文字漢語版最薄”的老梗。

    三、語言的演變趨勢

    人類語言總體上經歷了“綜合——分析”的演變歷程。早期印歐語是非常複雜的一種屈折語,詞形變化系統極為發達,例如梵語就是比較典型的一種屈折語,時體態性數格都非常複雜。拉丁語也有著豐富的屈折變化,在歐洲,法語、義大利語算是直接脫胎於拉丁語的次生語言,其屈折變化程度較拉丁語有了不同程度的簡化。在東方和西方社會中,代表古老勢力的群體往往採用更為複雜的綜合語,如羅馬教廷使用拉丁語,東南亞僧侶使用巴利語,這是所謂的傳統上層社會所使用的語言,而社會地位較低的階層所使用的語言則有著更為簡單的變化規則,比如英語。

    現代英語雖然被劃歸為屈折語,其實英語的屈折變化已經幾乎是屈折語中最弱的一種了。英語的時保留了一般現在時、一般過去時、一般將來時、過去將來時等,儲存較為完整;動詞變位僅存部分情態動詞和BE動詞的變化,一般動詞弱化為詞尾-s的區別;名詞變格僅存所屬格等基本格。按照屈折語的一般規律,詞序是不影響表達意義的,但是在英語中,能說詞序不重要嗎?“I eat chicken.”和“Chicken eats me.”能一樣?而且在近幾十年,英語詞序的重要性越來越高,屈折變化越來越弱,這是不是因為英語已經變成名副其實的世界語,擁有廣泛的使用群體有關呢?是否說明隨著時代的發展,語言會逐漸向分析語演化?

    其實漢語也不是一直都是分析語,在上古時期,漢語是有屈折變化的,有詞根、詞綴、人稱變化,但是在後來的發展演化中,漢語拋棄了這些屈折變化,現存的虛詞或許是古漢語曾經是綜合語的遺留痕跡。漢語的演化程序如此,英語的演化程序如此,俄語、德語的變化都是這樣。當然我們不能因此得出“分析語優於綜合語”的結論,因為演化程序並不一定總是朝著好的方向發展,但是人類本身的使用體驗會告訴我們哪種模式用著更爽。

    四、吾生也有涯 知也無涯

    從上面幾條的對比中我們可以發現其實沒有哪種語言能全方位無死角擊敗另一種語言,在一方面做出最佳化就必然在另一方面作出犧牲,比如音節數和聲調,比如屈折變化和語序。語言內部的功能似乎也在遵循某種守恆定律。如果一種語言的熵足夠大,那麼使用這種語言的人在一定時間內所接收到的資訊理論上就會比熵較低的語言使用者多。

    經常聽到的一個例子就是漢語跟日語的對比。前文也有提及,漢語的資訊密度是0.94,日語反過來,0.49。其實不難理解,日語中有著大量的外來詞,在音譯這些詞的時候由於日語本身音節特點的限制,不允許子音群的出現,沒有聲調輔助,就只有用多個音節來表達外語中的單音節,比如:

    gold ゴールド

    badminton バドミントン

    開拓 かいたく

    中國 ちゅうごく

    日語不得不在英語兩個或者多個子音連用的情況下采取多個音節來表達,對於漢語中的塞音韻尾也不得不單獨選擇一個音節來表示,這就使得日語的單詞平均音節數比來源詞長,其發音時間也比較長。“浪費時間”的日語真的會在單位時間內減少資訊的傳送量,好在日本人勤奮……日語並沒有阻礙日本文學的發展和科技的進步,但是如果日語是另一種效率更高的形態,日本會不會發展得更好也未可知。

    另一個跟時間和效率有關的議題是造詞法。漢語是語素語言,每個詞都是由兩個或多個語素構成的,故漢語成詞能力極強,在很少藉助外來語的情況下就能用固有語素生成新詞。如“卡車”、“電腦”等。英語雖然有詞根和詞綴等構詞法,但是在實際操作過程中這樣的構詞法會造成新詞過長,所以更多采用的是造一個新詞,而新詞之間並無聯絡。如“sheep、goat、wool、mutton、lamb”,對應的漢語是“綿羊、山羊、羊毛、羊肉、羊羔”。漢語的每個詞都使用到了“羊”這個語素,而英語找不到一個同源詞根。類似的情況在今天更為常見,每天都有英語新詞出現,而這種新詞跟舊詞之間或許根本沒有任何聯絡,導致英語詞典每年需要新增大量新詞,這些新詞不經專門學習則無法掌握。而在漢語中,想想去年的新詞:“共享充電寶”、“喪文化”、“戲精”、“佛系”等,透過成詞語素就能猜個不就不離十。不過,英語中也存在非常多的看字面就能理解的新詞,比如“yogacise”(瑜伽鍛鍊)、“facepalm”、“dadbod”(粑粑的啤酒肚)。

    但是涉及到專業術語,漢語和英語的區別就很明顯了。cholecystectomy是啥?不知道。中文叫“膽囊切除術”,是不是婆婆媽媽都能看懂了?這些來源於拉丁語或者別的語言的醫學屬於、法律術語不專門學習真不能理解。中文翻譯的時候採用漢語固有語素進行組合而不是直接音譯,也是漢語成詞靈活的一個表現。有限的生命如果都貢獻給背單詞似乎有點可惜了,這樣高效率利用語素來構詞也越來越多地被別的語言所採用,詞根+詞綴,詞根+詞根的構詞法更容易被理解,卻不得不增加單詞的長度,進而降低效率,又陷入另一個死衚衕。

  • 中秋節和大豐收的關聯?
  • 歷史上有哪些著名的借刀殺人千千萬萬的殺人犯?