回覆列表
-
1 # 使用者9175688961649
-
2 # 守侯的溫暖
在計算機中資訊處理的基本單位是位元組,現在計算機通常使用的ASCII碼。標準的ASCII碼是7位碼,用一個位元組8位表示,最高是奇偶校驗,一般為0,可以表示128個字元,所以一個字母只需要一個位元組。
只用ASCII碼是不可能實現漢字資訊處理的,要用不同的程式碼表示漢字的輸入、輸出,根據GB2312-80標準,每個位置在標準中被賦予兩種數字程式碼,一個是4位10進位制的區位碼,一個是用兩個位元組的16進位制數的國標碼。
擴充套件資料
位元組順序:
應該注意到,多位元組欄位中的值是按照大末尾(big- endian)順序規定的,具體來說就是最高位的位元組出現在高位,而低位的位元組出現在低位。這會引起工作在Intel平臺上的程式設計師的迷感,因為在 Intel的平臺上。資料是按照小末尾(little-endian)順序儲存的,高位的位元組出現在低位
位元組換算:
資訊儲存量是度量儲存器存放程式和資料的數量。其主要度量單位是位元組,1個位元組(Byte)等於8位(b)二進位制。位(bit,Binary Digits):存放一位二進位制數,即0或1,為最小的儲存單位,8個二進位制位為一個位元組單位。一個英文字母(不分大小寫)佔一個位元組的空間,一箇中文漢字佔兩個位元組的空間。英文標點佔一個位元組,中文標點佔兩個位元組。
一般計算機字元編碼都是採用的ASCII碼,它的範圍只有0-127,後經擴充套件也只達到0-255的範圍,對於用字母表示的英文,這個範圍已經足夠了(表示26個字母和數字等已綽綽有餘). 可是對於如漢字,日文,韓文等由字形組成的文字,這樣的範圍就太小了,所以一個漢字都是採用2個位元組來表示,並且2個位元組開頭的一個位元組最高位為1(目的是為了區分1個漢字與2個字母),這樣編碼範圍就大增加了.