這就要從資訊熵說起.
無論任何語言, 最常用的單詞都是2000到20000左右, 符號文字的單詞由字母組合組成, CJK文字由偏旁部首組成.
如果字母的個數太少的話, 比如只有兩個0和1, 那麼一個單詞就會由很長的重複字母組成, 比如把英文單詞轉換成ASCII碼的話, 那幾乎沒有任何可讀性. 對於記憶和表達使用都非常的不方便.
如果字母太多的話, 比如有100個, 其實是可以的.
這就涉及到一個語言的設計哲學了, 是使用相對少而簡單的字母組成符號文字, 還是使用非常多而複雜的字母組成象形文字.
如果把漢語的每個字看成字母的話, 那麼單詞和字母幾乎同義, 相當於一個單詞一個字母,那麼每個字母的表達能力非常強, 但是也非常複雜.
而符號語言的設計哲學是單個字母簡單, 一個單詞由有限長的字母組合組成.
漢語的優點就是字母表達能力強, 資訊量大, 透過兩個字母的組合幾乎可以從意義上表達所有新的科學術語, 達到望文生義的程度, 對於科學的普及非常有幫助. 缺點也正如其優點, 因為每個字母都是有強烈的意義的,所以組合出來的詞都帶有字母本身強烈的意義, 不利於組成新的抽象詞.
英語的優點就是字母有限而簡單,字母沒有含義, 可以非常容易組成新的單詞. 缺點也是其優點, 由於字母沒有含義,所以很難望文生義,所以英語發展出了詞根,一個詞根類似於漢語的一個字母, 一定程度的解決了這個問題.
總體上講, 符號文字的靈活性和符號化是比漢語更適合現代化的文字系統.
那麼為啥是26個呢, 根據以上論述, 兩種哲學思想都會走向數字的兩端, 漢字希望更多的字母, 英語希望更少的字母. 少到足夠少能展示符號系統的優越性, 但同時又不至於太少, 導致單詞很長,可讀性太差.
所以這樣的一個結果大概就是20~30個符號之間的系統最有效, 字母足夠的少而簡單, 又足夠的多不至於單詞太長重複太多很難記憶和表達.
另外一個原因, 20~30個字母的個數跟音節的數量也能很好的達成一致.
而音節數量, 字母數量的級數在大致一個數量級也不是一個巧合. 因為他們都是為了表達相同的語義而發展出來的文字和聲音系統, 簡單而有效的原則同時在兩個系統發生作用.
另外, 20~30個正好是一雙手10個手指打字最舒適的範圍, 這也是一個有意思的事情, 太少的手指不夠靈活有效,表達能力有限, 太多的手指效率太低, 付出的代價太大而受益太小, 也就是價效比太低, 所以最後10個手指是表達能力足夠強而又效率最高的數字, 而打字的話正好能覆蓋26個字母範圍.
你會發現宏觀世界很多數字都恰好能夠在一個數量級範圍內, 彼此互相適配, 非常有意思, 這中間都有千絲萬縷的聯絡, 這其中一個根本的原因都可以用資訊熵來解釋.
最後, 所有西方的符號文字都來自於腓尼基的符號系統, 這個系統是在商業中為了記事而發展出來的實用主義的文字, 當然其設計哲學就是儘量少而有效的符號, 組成能用的文字系統.
這就要從資訊熵說起.
無論任何語言, 最常用的單詞都是2000到20000左右, 符號文字的單詞由字母組合組成, CJK文字由偏旁部首組成.
如果字母的個數太少的話, 比如只有兩個0和1, 那麼一個單詞就會由很長的重複字母組成, 比如把英文單詞轉換成ASCII碼的話, 那幾乎沒有任何可讀性. 對於記憶和表達使用都非常的不方便.
如果字母太多的話, 比如有100個, 其實是可以的.
這就涉及到一個語言的設計哲學了, 是使用相對少而簡單的字母組成符號文字, 還是使用非常多而複雜的字母組成象形文字.
如果把漢語的每個字看成字母的話, 那麼單詞和字母幾乎同義, 相當於一個單詞一個字母,那麼每個字母的表達能力非常強, 但是也非常複雜.
而符號語言的設計哲學是單個字母簡單, 一個單詞由有限長的字母組合組成.
漢語的優點就是字母表達能力強, 資訊量大, 透過兩個字母的組合幾乎可以從意義上表達所有新的科學術語, 達到望文生義的程度, 對於科學的普及非常有幫助. 缺點也正如其優點, 因為每個字母都是有強烈的意義的,所以組合出來的詞都帶有字母本身強烈的意義, 不利於組成新的抽象詞.
英語的優點就是字母有限而簡單,字母沒有含義, 可以非常容易組成新的單詞. 缺點也是其優點, 由於字母沒有含義,所以很難望文生義,所以英語發展出了詞根,一個詞根類似於漢語的一個字母, 一定程度的解決了這個問題.
總體上講, 符號文字的靈活性和符號化是比漢語更適合現代化的文字系統.
那麼為啥是26個呢, 根據以上論述, 兩種哲學思想都會走向數字的兩端, 漢字希望更多的字母, 英語希望更少的字母. 少到足夠少能展示符號系統的優越性, 但同時又不至於太少, 導致單詞很長,可讀性太差.
所以這樣的一個結果大概就是20~30個符號之間的系統最有效, 字母足夠的少而簡單, 又足夠的多不至於單詞太長重複太多很難記憶和表達.
另外一個原因, 20~30個字母的個數跟音節的數量也能很好的達成一致.
而音節數量, 字母數量的級數在大致一個數量級也不是一個巧合. 因為他們都是為了表達相同的語義而發展出來的文字和聲音系統, 簡單而有效的原則同時在兩個系統發生作用.
另外, 20~30個正好是一雙手10個手指打字最舒適的範圍, 這也是一個有意思的事情, 太少的手指不夠靈活有效,表達能力有限, 太多的手指效率太低, 付出的代價太大而受益太小, 也就是價效比太低, 所以最後10個手指是表達能力足夠強而又效率最高的數字, 而打字的話正好能覆蓋26個字母範圍.
你會發現宏觀世界很多數字都恰好能夠在一個數量級範圍內, 彼此互相適配, 非常有意思, 這中間都有千絲萬縷的聯絡, 這其中一個根本的原因都可以用資訊熵來解釋.
最後, 所有西方的符號文字都來自於腓尼基的符號系統, 這個系統是在商業中為了記事而發展出來的實用主義的文字, 當然其設計哲學就是儘量少而有效的符號, 組成能用的文字系統.