位元組(Byte):位元組是透過網路傳輸資訊(或在硬碟或記憶體中儲存資訊)的單位。
一個英文字母(不分大小寫)佔一個位元組的空間,一箇中文漢字佔兩個位元組的空間.
符號:英文標點佔一個位元組,中文標點佔兩個位元組.
一個二進位制數字序列,在計算機中作為一個數字單元,一般為8位二進位制數,如一個ASCII碼就是一個位元組,此類單位的換算為:
1千吉位元組(TB,KiloGigaByte)=1024吉位元組 (2的40次方位元組)
(1TB=1024GB)
1吉位元組(GB,GigaByte) =1024兆位元組 (2的30次方位元組)
(1GB=1024MB)
1兆位元組(MB,MegaByte) =1024千位元組 (2的20次方位元組)
(1MB=1024KB)
1千位元組(KB,KiloByte) =1024位元組 (2的10次方位元組)
1位元組(Byte) = 8位(bit)
1.2 字元,位元組,字串
理解編碼的關鍵,是要把字元的概念和位元組的概念理解準確。這兩個概念容易混淆,我們在此做一下區分:
概念描述 舉例
字元 人們使用的記號,抽象意義上的一個符號。 "1", "中", "a", "$", "¥", ……
位元組 計算機中儲存資料的單元,一個8位的二進位制數,是一個很具體的儲存空間。 0x01, 0x45, 0xFA, ……
ANSI
字串 在記憶體中,如果“字元”是以 ANSI 編碼形式存在的,一個字元可能使用一個位元組或多個位元組來表示,那麼我們稱這種字串為 ANSI 字串或者多位元組字串。 "中文123"
(佔7位元組)
UNICODE
字串 在記憶體中,如果“字元”是以在 UNICODE 中的序號存在的,那麼我們稱這種字串為 UNICODE 字串或者寬位元組字串。 L"中文123"
(佔10位元組)
由於不同 ANSI 編碼所規定的標準是不相同的,因此,對於一個給定的多位元組字串,我們必須知道它採用的是哪一種編碼規則,才能夠知道它包含了哪些“字元”。而對於 UNICODE 字串來說,不管在什麼環境下,它所代表的“字元”內容總是不變的.
位元組(Byte):位元組是透過網路傳輸資訊(或在硬碟或記憶體中儲存資訊)的單位。
一個英文字母(不分大小寫)佔一個位元組的空間,一箇中文漢字佔兩個位元組的空間.
符號:英文標點佔一個位元組,中文標點佔兩個位元組.
一個二進位制數字序列,在計算機中作為一個數字單元,一般為8位二進位制數,如一個ASCII碼就是一個位元組,此類單位的換算為:
1千吉位元組(TB,KiloGigaByte)=1024吉位元組 (2的40次方位元組)
(1TB=1024GB)
1吉位元組(GB,GigaByte) =1024兆位元組 (2的30次方位元組)
(1GB=1024MB)
1兆位元組(MB,MegaByte) =1024千位元組 (2的20次方位元組)
(1MB=1024KB)
1千位元組(KB,KiloByte) =1024位元組 (2的10次方位元組)
1位元組(Byte) = 8位(bit)
1.2 字元,位元組,字串
理解編碼的關鍵,是要把字元的概念和位元組的概念理解準確。這兩個概念容易混淆,我們在此做一下區分:
概念描述 舉例
字元 人們使用的記號,抽象意義上的一個符號。 "1", "中", "a", "$", "¥", ……
位元組 計算機中儲存資料的單元,一個8位的二進位制數,是一個很具體的儲存空間。 0x01, 0x45, 0xFA, ……
ANSI
字串 在記憶體中,如果“字元”是以 ANSI 編碼形式存在的,一個字元可能使用一個位元組或多個位元組來表示,那麼我們稱這種字串為 ANSI 字串或者多位元組字串。 "中文123"
(佔7位元組)
UNICODE
字串 在記憶體中,如果“字元”是以在 UNICODE 中的序號存在的,那麼我們稱這種字串為 UNICODE 字串或者寬位元組字串。 L"中文123"
(佔10位元組)
由於不同 ANSI 編碼所規定的標準是不相同的,因此,對於一個給定的多位元組字串,我們必須知道它採用的是哪一種編碼規則,才能夠知道它包含了哪些“字元”。而對於 UNICODE 字串來說,不管在什麼環境下,它所代表的“字元”內容總是不變的.