回覆列表
  • 1 # 使用者4164580722351348

    區位碼:1981年國家頒佈了GB2312漢字標準共有6763個,其中一級3755,二級3008,還有682非漢字字元。

    併為每個字元規定了標準編碼,便於在計算機內部相互轉換。作為GB2312標準只是定義了一張94×94的二維表。其中行為區號,列為位號。這樣可以利用區號和位號來找到其中的漢字。這種編碼就是我們所說的區位碼。比如陳(1934) 區號:19 位號:34,為了處理與儲存的方便,每個漢字的區號和位號在計算機內部分別用一個位元組來表示 區位碼無法於漢字進行通訊,因為ASCII碼中規定了OOH-1F作為控制碼使用,這樣就發生了衝突。由於計算機不是華人發明的所以只能聽從於國際標準ISO2022規定區號和位號都加上32,這樣就防止衝突。經過加上32以後的編碼稱為國際交換碼 陳-區號:19+32= 51 00010011+00100000=00110011 位號:34+32=66 00100010+00100000=01000010 即5166 16進位制3342 由於文字中通常混合使用漢字和西文字元,漢字資訊如果不予以特別標識,就會與單位元組的ASCII碼混淆。此問題的解決方法之一是將一個漢字看成是兩個擴充套件ASCII碼,使表示GB2312漢字的兩個位元組的最高位都為1。這種高位為1的雙位元組漢字編碼即為GB2312漢字的機內碼,簡稱為“內碼”. 00110011最高位變為1則從33變為B3 01000010最高位變為1則從42變為C2 這樣一來,陳的機內碼應該為B3C2 這裡要說明的是不管你是採用什麼樣的輸入法輸入漢字,其漢字的機內碼都是相同的。如果要從一個漢字的機內碼轉換為區位碼,其實就是相反的方向進行運算.

  • 中秋節和大豐收的關聯?
  • 魔獸世界大秘境3箱子是什麼意思?