用unicode把檔名改寫為唯一編碼怎麼寫？

首頁>Club>2021-02-24 17:26

用unicode把檔名改寫為唯一編碼怎麼寫？

回覆列表

1 # 使用者1465424935672

在命令列介面用native2ascii工具

1.將漢字轉為Unicode:

C:\Program Files\Java\jdk1.5.0_04\bin>native2ascii

測試

\u6d4b\u8bd5

2.將Unicode轉換為漢字:
C:\Program Files\Java\jdk1.5.0_04\bin>native2ascii -reverse

\u6d4b\u8bd5

測試

java 自帶的一個native2ascii.exe是一個很好的轉碼工具，在bin目錄下。如果你的properties中有漢字，需要轉成unicode . 則把含有漢字的properties複製到bin 目錄下，然後在cmd裡面進入bin目錄，輸入：native2ascii -encoding utf-8 Language-ext_zh_CN.properties.native Language-ext_zh_CN.properties就ok了。Language-ext_zh_CN.properties是轉碼後的檔案。
在做Java開發的時候，常常會出現一些亂碼，或者無法正確識別或讀取的檔案，比如常見的validator驗證用的訊息資源（properties）檔案就需要進行Unicode重新編碼。原因是java預設的編碼方式為Unicode，而我們的計算機系統編碼常常是GBK等編碼。需要將系統的編碼轉換為java正確識別的編碼問題就解決了。

1、native2ascii簡介：native2ascii 是sun java sdk提供的一個工具。用來將別的文字類檔案（比如*.txt,*.ini,*.properties,*.java等等）編碼轉為Unicode編碼。為什麼要進行轉碼，原因在於程式的國際化。Unicode編碼的定義：Unicode（統一碼、萬國碼、單一碼）是一種在計算機上使用的字元編碼。它為每種語言中的每個字元設定了統一併且唯一的二進位制編碼，以滿足跨語言、跨平臺進行文字轉換、處理的要求。1990年開始研發，1994年正式公佈。隨著計算機工作能力的增強，Unicode也在面世以來的十多年裡得到普及。（宣告：Unicode編碼定義來自網際網路）。
2、獲取native2ascii：安裝了jdk後，假如你是在windows上安裝，那麼在jdk的安裝目錄下，會有一個bin目錄，其中native2ascii.exe正是。

3、native2ascii的命令列的命名格式：

native2ascii -[options] [inputfile [outputfile]]

說明：

-[options]：表示命令開關，有兩個選項可供選擇

-reverse：將Unicode編碼轉為本地或者指定編碼，不指定編碼情況下，將轉為本地編碼。

-encoding encoding_name：轉換為指定編碼，encoding_name為編碼名稱。
[inputfile [outputfile]]

inputfile：表示輸入檔案全名。

outputfile：輸出檔名。如果缺少此引數，將輸出到控制檯。

4、最佳實踐：首先將JDK的bin目錄加入系統變數path。在盤下建立一個test目錄，在test目錄裡建立一個zh.txt檔案，檔案內容為：“熔岩”，開啟“命令列提示符”，並進入C:\test目錄下。下面就可以按照說明一步一步來操作，注意觀察其中編碼的變化。

A：將zh.txt轉換為Unicode編碼，輸出檔案到u.txt

native2ascii zh.txt u.txt

開啟u.txt，內容為“\u7194\u5ca9”。
B：將zh.txt轉換為Unicode編碼，輸出到控制檯

C:\test>native2ascii zh.txt

\u7194\u5ca9

可以看到，控制檯輸出了“\u7194\u5ca9”。

C：將zh.txt轉換為ISO8859-1編碼，輸出檔案到i.txt

native2ascii -encoding ISO8859-1 zh.txt i.txt

開啟i.txt檔案，內容為“\u00c8\u00db\u00d1\u00d2”。

D：將u.txt轉換為本地編碼，輸出到檔案u_nv.txt

native2ascii -reverse u.txt u_nv.txt
開啟u_nv.txt檔案，內容為“熔岩”。

E：將u.txt轉換為本地編碼，輸出到控制檯

C:\test>native2ascii -reverse u.txt

熔岩

可以看到，控制檯輸出了“熔岩”。

F：將i.txt轉換為本地編碼，輸出到i_nv.txt

native2ascii -reverse i.txt i_nv.txt

開啟i_nv.txt檔案，內容為“\u00c8\u00db\u00d1\u00d2”。發現轉碼前後完全一樣的。也就是說，等於沒有轉，或者說思想糊塗，對命名沒有理解。。

G：將i.txt轉換為GBK編碼，輸出到i_gbk.txt
native2ascii -reverse -encoding GBK i.txt i_gbk.txt

開啟i_gbk.txt檔案，內容為“\u00c8\u00db\u00d1\u00d2”。發現轉碼前後完全一樣的。也就是說，等於沒有轉，或者說思想糊塗，對命名沒有理解。

H：將u_nv.txt轉碼到本地編碼GBK，輸出到控制檯

C:\test>native2ascii -reverse -encoding ISO8859-1 i.txt

熔岩

從這個結果看，目標達到到了，編碼i.txt為ISO8859-1，轉為本地編碼後內容為“熔岩”。從這裡應該意識到，native2ascii -reverse命令中-encoding指定的編碼為原始檔的編碼格式。而在native2ascii 命令中-encoding指定的編碼為（生成的）目標檔案的編碼格式。這一點非常的重要！切記！！
繼續探索，新建檔案12a.txt，內容“12axyz”。看看純字母數字的編碼又如何。

I：將純字母數字的文字檔案12a.txt轉換為Unicode編碼

native2ascii 12a.txt 12a_nv.txt

開啟12a_nv.txt檔案，內容為“12axyz”。

繼續測試，轉為ISO8859-1編碼看看

C:\test>native2ascii -encoding ISO8859-1 12a.txt

12axyz

結果還是沒有轉碼。

從結果可以得出結論：對於純數字和字母的文字型別件，轉碼前後的內容是一樣的。

劇多

用unicode把檔名改寫為唯一編碼怎麼寫？

相關內容