GB2312何時能夠代替UTF-8？

首頁>Club>窩裡玩2021-04-10 06:28

為什麼現在很多程式偏向於UTF-8而不是中文編碼？我們這麼大市場真的在乎其他嗎？還是相容性問題？

回覆列表

1 # 學好玩

真能挑事啊，還知道GB2312，請問GB2312的6763個字元能能覆蓋博大精深的漢語言文學嗎？另外GBK和GB18030瞭解一下？UTF-8是國際標準，GB2312永遠代替不了UTF-8，何況還有UTF-7、16、32等等，與其胡思亂想，不如多學習吧。

2 # 浪花見岸

GB2312，1980年釋出，收入漢字6763個（基本是簡體）。GBK，1995年釋出，收錄21003個漢字（常用簡體、繁體）。GB18030，2000年釋出，覆蓋所有Unicode code point（理論上有1114112個）。
在儲存常用漢字時，UTF-8比GB系列佔用空間多。
一個常用漢字（BMP內）用UTF-8需要3個位元組，用GB系列只要2個位元組。
3 # 俠客居士1

只能說胡言亂語。我大公司的程式設計規範必須要用utf8. 如果你是小公司小程式，你愛啥是啥，只要你自己不嫌麻煩。

4 # BOAQ

提這個問題的真是無知，GB2312能力相當低。之所以存在這麼多地域性編碼，很大原因是當初沒有設計出一套適用於所有國家的編碼方式，直到能一統江湖的UTF編碼出現。假如你做貿易，只用GB2312編碼連對方的檔案都打不開，所有的翻譯軟體都別活了，因為他們顯示不出來外文字元。
5 # 還有一隻喵

只能反過來代替。這就如同問大哥大何時代替智慧機，無聲電影何時代替有聲電影一樣。utf-8是更好的解決方案。
其一，gb2312字不全。許多稍微生僻一點的字就打不出來，utf-8解決了這個問題
其二，兩岸三地編碼不通。玩過老港臺遊戲的網友經常有面對亂碼的經歷，還得裝個南極星什麼的。utf8普及之後，這種就很少了。
其三，utf8更國際化。它包括幾乎現在所有想象得到的語言字元。這意味著各國主流開發者都用這種編碼，就免去了國外軟體動不動不支援中文的麻煩事。

6 # maxhw

兩者根本不是一個概念好不好，GB2312是字元編碼；utf-8是傳輸編碼。GB2312同等含義的國際編碼叫unicode。unicode是國際字元編碼。

unicode編碼中的中文字元使用了全部的16bits，而英文字元只使用了uincode的8bits。而英文在傳輸及儲存過程中，使用頻率又特別大，在使用完整unicode的情況下，檔案尺寸差不多比純英文字元大一倍。為了節約儲存/傳輸空間，對unicode進行了二次編碼（也可以理解為資料壓縮演算法），這才有了utf-8。理論上講，GB2312的文字在儲存過程中也可以使用utf-8，兩者根本不衝突。
所以GB2312和utf-8完全是兩個概念，這幾年，面試過程中遇到很多java程式設計師，根本搞不清楚這兩個概念，其中不少程式設計師都分佈在bat中，說實話，挺丟人的，跟他們講道理，還不聽，因為utf-8已經潛規則程式設計unicode的代名詞了。無語中......
7 # ScholarMartin

不幸的是GB2312被UTF-8等代替了。
GB2312只是利用擴充套件ASCII碼的0xA0～0xFE來表示漢字的修補方案，分95區95位，保留16個區用於特殊字元，最多可以表示7505個簡體字。

8 # 日衝資訊黃

Unicode 編碼涵蓋了世界上幾乎所有的語言，而GB2312只有中文簡體+日語片假名+俄語字母。
支援GB2312編碼的程式，只能在支援GB2312的系統上執行，否則就會產生亂碼。中國很大，語言也不只有簡體中文，還有繁體中文、蒙語、藏語、北韓語等等。這些語言的文字GB2312都不能支援。我猜您是出於民族自豪感的情懷，想讓GB2312獨佔中國市場。可是別忘了中國不僅僅有大陸，還有香港、臺灣；不僅僅有漢族，還有其它55個民族。它們都有自己的語言和文字，上綱上線的說，您不會是想分裂祖國吧。