"直接用輸入法打出來的字" -- 這裡含好幾個過程。
(1)當你用鍵盤打字時,從鍵盤進入計算機的是ASCII碼序列。
(2)“輸入法”把 ASCII碼序列 轉換成 輸入法 自己規定的 碼。
(3)你在一個窗上看到的東西,例如 notepad 的文字編輯窗,wordpad 的文字編輯窗, 或 DOS 黑窗(控制檯命令窗)那是 把 “輸入法自己規定的碼”顯示出來,這裡有一個編碼到字型(font)到bitmap點陣圖形的轉換。只有當它們匹配時才能顯示出有意義的 字的形狀。否則看上去是“亂碼”。
以DOS 黑窗為例,只有正確設定它的 所謂 內碼表(code page) ,才能顯示出有意義的字形。
GBK的code page是CP936;
BIG5的code page是CP950;
GB2312的code page是CP20936;
DOS 命令 CHCP 不帶引數 可以顯示 當前 “內碼表”,加引數可以改變 “內碼表"
例如:chcp 936 例如: chcp 437
(4)從文字編輯窗 到 存放的檔案 也有 程式碼的轉換。
例如,notepad, 可以存放為 unicode 小端碼,unicode 大端碼,UTF-8碼.
unicode 檔案會在檔案頭自動新增 unicode BOM ( Byte-Order Mark)
---
所以, 直接用輸入法打出來的字是什麼編碼的呢,具體情況具體分析,不可一概而論。
"直接用輸入法打出來的字" -- 這裡含好幾個過程。
(1)當你用鍵盤打字時,從鍵盤進入計算機的是ASCII碼序列。
(2)“輸入法”把 ASCII碼序列 轉換成 輸入法 自己規定的 碼。
(3)你在一個窗上看到的東西,例如 notepad 的文字編輯窗,wordpad 的文字編輯窗, 或 DOS 黑窗(控制檯命令窗)那是 把 “輸入法自己規定的碼”顯示出來,這裡有一個編碼到字型(font)到bitmap點陣圖形的轉換。只有當它們匹配時才能顯示出有意義的 字的形狀。否則看上去是“亂碼”。
以DOS 黑窗為例,只有正確設定它的 所謂 內碼表(code page) ,才能顯示出有意義的字形。
GBK的code page是CP936;
BIG5的code page是CP950;
GB2312的code page是CP20936;
DOS 命令 CHCP 不帶引數 可以顯示 當前 “內碼表”,加引數可以改變 “內碼表"
例如:chcp 936 例如: chcp 437
(4)從文字編輯窗 到 存放的檔案 也有 程式碼的轉換。
例如,notepad, 可以存放為 unicode 小端碼,unicode 大端碼,UTF-8碼.
unicode 檔案會在檔案頭自動新增 unicode BOM ( Byte-Order Mark)
---
所以, 直接用輸入法打出來的字是什麼編碼的呢,具體情況具體分析,不可一概而論。