-
1 # 燕子愛生活呀
-
2 # 饅頭353
小時候老師經常說的一句話,念十遍不如寫一遍,把所有的字都學會,打亂順序你還能知道,你就成功了。這首歌不就是為了傳承中國文字嗎,網紅是會唱,但是讓他們寫可就要了他們的命了。
-
3 # 放牛娃娛樂播報
眾所周知,漢字不同於西方的文字系統。
可以透過字母的線性組合形成單詞,再連綴成句;我們的漢字系統是透過構字部件(俗稱偏旁)的平面組合形成漢字,再連綴成句的。很遺憾的是計算機是西方人發明的,規則定製也多以西方的習慣為原型,漢字的資訊化也只好削足適履,被動適應西方標準。
目前大部分的漢字字符集(包括 Unicode),對於漢字編碼的處理大致為先蒐集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以蒐集到所有漢字。
基於這種考慮,Unicode 組織在 3.0 版本開始,對 CJKV 統一表意文字做了一個新的支援——表意文字描述序列(Ideographic Description Sequences,以下簡稱IDS)。其目的是利用十二種組合字元,來描述所定義的漢字內部構字部件的相對位置,從而精確表示生僻字(或未被電腦字符集收入的缺字)。
如果大家有關注「疑難字辨識」話題的話,應該會注意到這些題目的風格都很接近(都使用了「⿰⿱⿲⿳⿴⿵⿶⿷⿸⿹⿺⿻」等符號來表示生僻字)。這十二個符號的名字叫做「表意文字描述字元」(Ideographic Description Characters,以下簡稱IDC)。
其使用方法如下:
那麼有人或許要問,如果我所要表示的漢字的構字部件不止兩個怎麼辦呢?
沒關係,我們可以繼續往下擴寫,類似 1×2÷3+4-5 這樣的數學運算表示式。這種表示式就是筆者前文提到的 IDS 。
其中構字部件相當於數學運算表示式中的數字和未知數,十二種 IDC 相當於數學運算表示式中的算術運算子。就像下面這樣:
這裡還要注意兩個細節:
1丶十二種 IDC 之間沒有優先順序順序。(優先順序順序相當於算術運算子中的先乘除,後加減。當然你瞭解蛋疼的 C 語言運算子優先順序順序更好。)
如上圖例 4 所示,用字首表示式構造的 IDS ⿸廠⿱今止 相當於 ⿸廠(⿱今止) 。即先對「今」和「止」做上下結構的拼合,再對這個拼合部件與「廠」做左上方的半包圍拼合。將這個 IDS 轉換成普通的中綴表示式應該是 廠⿸(今⿱止) 。
另外,漢字構字部件拆分的粒度完全由你自己決定,只要你覺得能表示到位就可以。如上圖的例 1、2、3 以及例 5、6、7、8 各自表示同一個漢字。(就像算術表示式 1+2 與 1+(1+1) 等價一樣)
接著我們來實練一次吧。
回覆列表
窮窮傑立,哼謝一氣。
居居獨行,踢湖逛頂
綿綿瓜跌,奉為龜滅。
龍行打打,雞角嘎啦。
拼亭鳥羅,踢死胖坨。
姥姥不休,不浪不友。
昂
多節 電線 貓鐵 老鐵
淋雨 英語 鯽魚 舉魚
有娥勿選 虎耳不全
其累灰灰 啊渣結局
吃髮簪逼真邊時 幣
林吃字幣 一張一息
參考下哈哈