ASCII碼使用一個位元組編碼,所以它的範圍基本是隻有英文字母、數字和一些特殊符號 ,只有256個字元。在表示一個Unicode的字元時,通常會用“U+”然後緊接著一組十六進位制的數字來表示這一個字元。在基本多文種平面(英文為 Basic Multilingual Plane,簡寫 BMP。它又簡稱為“零號平面”, plane 0)裡的所有字元,要用四位十六進位制數(例如U+4AE0,共支援六萬多個字元);在零號平面以外的字元則需要使用五位或六位十六進位制數了。舊版的Unicode標準使用相近的標記方法,但卻有些微的差異:在Unicode 3.0裡使用“U-”然後緊接著八位數,而“U+”則必須隨後緊接著四位數。Unicode能夠表示全世界所有的位元組GBK是隻用來編碼漢字的,GBK全稱《漢字內碼擴充套件規範》,使用雙位元組編碼。UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼。由Ken Thompson於1992年建立。現在已經標準化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。
ASCII碼使用一個位元組編碼,所以它的範圍基本是隻有英文字母、數字和一些特殊符號 ,只有256個字元。在表示一個Unicode的字元時,通常會用“U+”然後緊接著一組十六進位制的數字來表示這一個字元。在基本多文種平面(英文為 Basic Multilingual Plane,簡寫 BMP。它又簡稱為“零號平面”, plane 0)裡的所有字元,要用四位十六進位制數(例如U+4AE0,共支援六萬多個字元);在零號平面以外的字元則需要使用五位或六位十六進位制數了。舊版的Unicode標準使用相近的標記方法,但卻有些微的差異:在Unicode 3.0裡使用“U-”然後緊接著八位數,而“U+”則必須隨後緊接著四位數。Unicode能夠表示全世界所有的位元組GBK是隻用來編碼漢字的,GBK全稱《漢字內碼擴充套件規範》,使用雙位元組編碼。UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼。由Ken Thompson於1992年建立。現在已經標準化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。