"直接用輸入法打出來的字"--這裡含好幾個過程。
(1)當你用鍵盤打字時,從鍵盤進入計算機的是ASCII碼序列。
(2)“輸入法”把ASCII碼序列轉換成輸入法自己規定的碼。
(3)你在一個窗上看到的東西,例如notepad的文字編輯窗,wordpad的文字編輯窗,或DOS黑窗(控制檯命令窗)那是把“輸入法自己規定的碼”顯示出來,這裡有一個編碼到字型(font)到bitmap點陣圖形的轉換。只有當它們匹配時才能顯示出有意義的字的形狀。否則看上去是“亂碼”。
以DOS黑窗為例,只有正確設定它的所謂內碼表(codepage),才能顯示出有意義的字形。
GBK的codepage是CP936;
BIG5的codepage是CP950;
GB2312的codepage是CP20936;
DOS命令CHCP不帶引數可以顯示當前“內碼表”,加引數可以改變“內碼表"
例如:chcp936例如:chcp437
(4)從文字編輯窗到存放的檔案也有程式碼的轉換。
例如,notepad,可以存放為unicode小端碼,unicode大端碼,UTF-8碼.
unicode檔案會在檔案頭自動新增unicodeBOM(Byte-OrderMark)
---
所以,直接用輸入法打出來的字是什麼編碼的呢,具體情況具體分析,不可一概而論。
拼音、五筆、鄭碼等都統稱為輸入碼,漢字輸入就是把輸入碼轉化為機內碼,漢字輸出就是根據機內碼在字型檔中查詢相應的字,找到後即可顯示漢字
"直接用輸入法打出來的字"--這裡含好幾個過程。
(1)當你用鍵盤打字時,從鍵盤進入計算機的是ASCII碼序列。
(2)“輸入法”把ASCII碼序列轉換成輸入法自己規定的碼。
(3)你在一個窗上看到的東西,例如notepad的文字編輯窗,wordpad的文字編輯窗,或DOS黑窗(控制檯命令窗)那是把“輸入法自己規定的碼”顯示出來,這裡有一個編碼到字型(font)到bitmap點陣圖形的轉換。只有當它們匹配時才能顯示出有意義的字的形狀。否則看上去是“亂碼”。
以DOS黑窗為例,只有正確設定它的所謂內碼表(codepage),才能顯示出有意義的字形。
GBK的codepage是CP936;
BIG5的codepage是CP950;
GB2312的codepage是CP20936;
DOS命令CHCP不帶引數可以顯示當前“內碼表”,加引數可以改變“內碼表"
例如:chcp936例如:chcp437
(4)從文字編輯窗到存放的檔案也有程式碼的轉換。
例如,notepad,可以存放為unicode小端碼,unicode大端碼,UTF-8碼.
unicode檔案會在檔案頭自動新增unicodeBOM(Byte-OrderMark)
---
所以,直接用輸入法打出來的字是什麼編碼的呢,具體情況具體分析,不可一概而論。