decode到unicode後扔字數統計。。py一句話:import collections
wordcount = collections.Counter(open("text.txt", "r").read().decode("gbk", "ignore"))
#gbk或者utf8根據輸入文字來改。。
#如果想輸出到檔案,再加一行。。
open("output.txt", "w").write("\n".join("%s\t%s" % (word,count) for word,count in wordcount.items()).encode("gbk"))
decode到unicode後扔字數統計。。py一句話:import collections
wordcount = collections.Counter(open("text.txt", "r").read().decode("gbk", "ignore"))
#gbk或者utf8根據輸入文字來改。。
#如果想輸出到檔案,再加一行。。
open("output.txt", "w").write("\n".join("%s\t%s" % (word,count) for word,count in wordcount.items()).encode("gbk"))
word+excel也可以。1. 文件貼到txt裡去除格式,再貼到word裡,每個字後加回車:word裡查詢^?,替換成^&^pps.. ^?表示任意單個字元,^&表示查詢到的對應字元,^p是新段落。2. 得到的結果貼到excel,資料透視表選計數