首頁>Club>
為什麼現在很多程式偏向於UTF-8而不是中文編碼?我們這麼大市場真的在乎其他嗎?還是相容性問題?
8
回覆列表
  • 1 # 學好玩

    真能挑事啊,還知道GB2312,請問GB2312的6763個字元能能覆蓋博大精深的漢語言文學嗎?另外GBK和GB18030瞭解一下?UTF-8是國際標準,GB2312永遠代替不了UTF-8,何況還有UTF-7、16、32等等,與其胡思亂想,不如多學習吧。

  • 2 # 浪花見岸

    GB2312,1980年釋出,收入漢字6763個(基本是簡體)。GBK,1995年釋出,收錄21003個漢字(常用簡體、繁體)。GB18030,2000年釋出,覆蓋所有Unicode code point(理論上有1114112個)。

    在儲存常用漢字時,UTF-8比GB系列佔用空間多。

    一個常用漢字(BMP內)用UTF-8需要3個位元組,用GB系列只要2個位元組。

  • 3 # 俠客居士1

    只能說胡言亂語。我大公司的程式設計規範必須要用utf8. 如果你是小公司小程式,你愛啥是啥,只要你自己不嫌麻煩。

  • 4 # BOAQ

    提這個問題的真是無知,GB2312能力相當低。之所以存在這麼多地域性編碼,很大原因是當初沒有設計出一套適用於所有國家的編碼方式,直到能一統江湖的UTF編碼出現。假如你做貿易,只用GB2312編碼連對方的檔案都打不開,所有的翻譯軟體都別活了,因為他們顯示不出來外文字元。

  • 5 # 還有一隻喵

    只能反過來代替。這就如同問大哥大何時代替智慧機,無聲電影何時代替有聲電影一樣。utf-8是更好的解決方案。

    其一,gb2312字不全。許多稍微生僻一點的字就打不出來,utf-8解決了這個問題

    其二,兩岸三地編碼不通。玩過老港臺遊戲的網友經常有面對亂碼的經歷,還得裝個南極星什麼的。utf8普及之後,這種就很少了。

    其三,utf8更國際化。它包括幾乎現在所有想象得到的語言字元。這意味著各國主流開發者都用這種編碼,就免去了國外軟體動不動不支援中文的麻煩事。

  • 6 # maxhw

    兩者根本不是一個概念好不好,GB2312是字元編碼;utf-8是傳輸編碼。GB2312同等含義的國際編碼叫unicode。unicode是國際字元編碼。

    unicode編碼中的中文字元使用了全部的16bits,而英文字元只使用了uincode的8bits。而英文在傳輸及儲存過程中,使用頻率又特別大,在使用完整unicode的情況下,檔案尺寸差不多比純英文字元大一倍。為了節約儲存/傳輸空間,對unicode進行了二次編碼(也可以理解為資料壓縮演算法),這才有了utf-8。理論上講,GB2312的文字在儲存過程中也可以使用utf-8,兩者根本不衝突。

    所以GB2312和utf-8完全是兩個概念,這幾年,面試過程中遇到很多java程式設計師,根本搞不清楚這兩個概念,其中不少程式設計師都分佈在bat中,說實話,挺丟人的,跟他們講道理,還不聽,因為utf-8已經潛規則程式設計unicode的代名詞了。無語中......

  • 7 # ScholarMartin

    不幸的是GB2312被UTF-8等代替了。

    GB2312只是利用擴充套件ASCII碼的0xA0~0xFE來表示漢字的修補方案,分95區95位,保留16個區用於特殊字元,最多可以表示7505個簡體字。

  • 8 # 日衝資訊 黃

    Unicode 編碼涵蓋了世界上幾乎所有的語言,而GB2312只有中文簡體+日語片假名+俄語字母。

    支援GB2312編碼的程式,只能在支援GB2312的系統上執行,否則就會產生亂碼。中國很大,語言也不只有簡體中文,還有繁體中文、蒙語、藏語、北韓語等等。這些語言的文字GB2312都不能支援。我猜您是出於民族自豪感的情懷,想讓GB2312獨佔中國市場。可是別忘了中國不僅僅有大陸,還有香港、臺灣;不僅僅有漢族,還有其它55個民族。它們都有自己的語言和文字,上綱上線的說,您不會是想分裂祖國吧。

  • 中秋節和大豐收的關聯?
  • 蘿蔔肉質根表面粗糙和白鏽產生的原因與防止措施有哪些?