-
1 # 萬事順意16888
-
2 # 使用者5262446717498
一個漢字字形碼在不同的編碼體系中可能佔2位元組或3位元組甚至4位元組。
GB2312編碼、GBK編碼中漢字字元佔2位元組。
GB18030採用多位元組編碼,每個字元可以由 1 個、2 個或 4 個位元組組成。
Unicode與ISO 10646編碼
定義了一個超大的字符集,它可以容納全世界所有的文字字元,再對它們統一進行編碼,讓每一個字元都對應一個不同的編碼值,這裡每個字元就佔4個位元組。
UTF-16與UTF-32中,漢字字元佔3個位元組。
字元的編碼既要能包含足夠多的字元,又要儘量少佔用儲存資源,還要相容產業歷史。
-
3 # 使用者98019625999
一般佔用兩個位元組。
1個ASCII碼佔1個位元組,而1個漢字編碼佔2個位元組。
這是指漢字編碼,就象每個字元都有一個ASCII碼一樣。
如果是在UTF-8編碼下,一個漢字佔3個位元組,UTF-8是一種國際通用的一種變長編碼。
西方文字(希臘文字)佔2個字元,中文佔用3個位元組數,還有平面符號佔4個位元組。
漢字,又稱中文字,中國字,方塊字,屬於表意文字的詞素音節文字。漢字是漢語的書寫用文字 ,也被借用於書寫日語,北韓語,越南語等語言,是漢字文化圈廣泛使用的一種文字,也是目前世界上唯一仍被廣泛使用的高度發達的文字。
-
4 # 暖太陽1535
一個漢字=2位元組
中文標點佔三個位元組,一個英文字母佔一個位元組,英文標點佔一個位元組。
位元組的換算關係為:
1位元組(Byte)=8字位=8個二進位制數
1字位(bit)=1個二進位制數
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
b稱為字位、B稱為位元組、KB稱為千位元組、MB稱為兆位元組、GB稱為吉位元組。
擴充套件資料:
不同的編碼格式佔位元組數是不同的,以下為不同編碼漢字、標點符號所佔用的位元組:
1、ASCII碼:一箇中文(含繁體)佔兩個位元組,一箇中文標點佔三個位元組。一個英文字母佔一個位元組的,一個英文標點佔一個位元組。
2、UTF-8編碼:一箇中文(含繁體)佔三個位元組,一箇中文標點佔三個位元組。一個英文字母佔一個位元組,一個英文標點佔一個位元組。
3、Unicode編碼:一箇中文(含繁體)佔兩個位元組,一箇中文標點佔兩個位元組。一個英文佔兩個位元組,一個英文標點佔一個位元組。
-
5 # 使用者5918063268207
一個漢字字型碼佔用兩個位元組。
1個漢字需要2個位元組。主要可以是說我們中文漢字比字母多很多,使用字母那套編碼無法相容完我們的漢字。一個位元組是8個位(bit),最多可以表示256個對應字元(2的8次方)。
如果是2個位元組則是16個位(bit),最多可以表示65536個對應字元(2的16次方)。同時也是為了計算機系統原有電子邏輯,則採用2個位元組的漢字編碼。
-
6 # 使用者3338745230945
一個漢字字形碼在不同的編碼體系中可能佔2位元組或3位元組甚至4位元組。
GB2312編碼、GBK編碼中漢字字元佔2位元組。
GB18030採用多位元組編碼,每個字元可以由 1 個、2 個或 4 個位元組組成。
Unicode與ISO 10646編碼
定義了一個超大的字符集,它可以容納全世界所有的文字字元,再對它們統一進行編碼,讓每一個字元都對應一個不同的編碼值,這裡每個字元就佔4個位元組。
-
7 # 使用者6932020393854
一個漢字的機內碼佔2個位元組。
漢字 hànzì
[Chinese characters] 記錄漢語的文字。現用漢字是從甲骨文、金文、篆文、隸書演變而來:在形體上逐漸由圖形變為筆畫,象形變為象徵,複雜變為簡單;在造字原則上從表形、表意到形聲。一個字一個音節,絕大多數是形聲字。北韓、越南、日本曾使用漢字千餘年
-
8 # 使用者558168890935051
一個位元組由8個二進位制位構成,可以有2^8=256個不同的狀態,也就有256個不同的編碼。
回覆列表
一個漢字字形碼佔兩個位元組。
中文標點佔三個位元組,一個英文字母佔一個位元組,英文標點佔一個位元組。
位元組的換算關係為:
1位元組(Byte)=8字位=8個二進位制數
1字位(bit)=1個二進位制數
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
b稱為字位、B稱為位元組、KB稱為千位元組、MB稱為兆位元組、GB稱為吉位元組。