第一:主題和意義
你為什麼需要製作個性化詞雲,是藝術品還是研究分析內容的一種表現方式,是文字挖掘技術的視覺化,還是為了傳播更方便。形式大於內容,在有內容的前提下,視覺化也是一種分析!當然我更傾向文字挖掘後的內容視覺化。
當然,我也不反對純粹為了表現或者玩玩的視覺化,玩也是一種學習。 因此選擇什麼主題,什麼主題適合用個性化詞雲表現就更為重要了。比如:為大人物明星打標籤,品牌logo打標籤,SUV汽車打標籤,電視臺臺標打標籤都是好的創意和選擇。
第二:語料收集
個性化詞雲是依賴語料和抽取語料關鍵詞呈現的,如果你有了要表現的詞雲標籤,就可以直接製作詞雲了。記住這裡要有兩個資料:1、標籤關鍵詞 2、關鍵詞詞頻,詞頻決定關鍵詞的顯示大小。
第三:分詞和關鍵詞抽取
當你獲得語料後,如果需要抽取關鍵詞,就需要學習中文分詞。中文分詞對一些人是技術和障礙,但是現在中文分詞是一個簡單而通用的技術,很多軟體和線上工具都可以完成一般意義下的分詞。
如:Rweibo、weiRbo、中科院張華平老師ICTCLAS2012、武大瀋陽老師的ROST CM等,這裡推薦初學者考慮用ROST-CM工具入手,分詞主要考慮是否可以使用者自定義詞典和剔除、詞性標註等。
少量語料的分詞比較簡單,但海量語料的分詞要有一定難度和資料處理能力。
特別強調:任何中文分詞如果能夠加入人工干涉和主觀判斷都會提升準確性和有效性;下面介紹的線上個性化分詞本身也可完成分詞。(包括中文分詞,體驗效果:不同語料和多少,時好時壞)
視覺化(Visualization)是利用計算機圖形學和影象處理技術,將資料轉換成圖形或影象在螢幕上顯示出來,並進行互動處理的理論、方法和技術。
它涉及到計算機圖形學、影象處理、計算機視覺、計算機輔助設計等多個領域,成為研究資料表示、資料處理、決策分析等一系列問題的綜合技術。目前正在飛速發展的虛擬現實技術也是以圖形影象的視覺化技術為依託的。
視覺化的意義
2、增強理解、便於對話、探索、交流。
3、簡化複雜性,增強審視。
第一:主題和意義
你為什麼需要製作個性化詞雲,是藝術品還是研究分析內容的一種表現方式,是文字挖掘技術的視覺化,還是為了傳播更方便。形式大於內容,在有內容的前提下,視覺化也是一種分析!當然我更傾向文字挖掘後的內容視覺化。
當然,我也不反對純粹為了表現或者玩玩的視覺化,玩也是一種學習。 因此選擇什麼主題,什麼主題適合用個性化詞雲表現就更為重要了。比如:為大人物明星打標籤,品牌logo打標籤,SUV汽車打標籤,電視臺臺標打標籤都是好的創意和選擇。
第二:語料收集
個性化詞雲是依賴語料和抽取語料關鍵詞呈現的,如果你有了要表現的詞雲標籤,就可以直接製作詞雲了。記住這裡要有兩個資料:1、標籤關鍵詞 2、關鍵詞詞頻,詞頻決定關鍵詞的顯示大小。
第三:分詞和關鍵詞抽取
當你獲得語料後,如果需要抽取關鍵詞,就需要學習中文分詞。中文分詞對一些人是技術和障礙,但是現在中文分詞是一個簡單而通用的技術,很多軟體和線上工具都可以完成一般意義下的分詞。
如:Rweibo、weiRbo、中科院張華平老師ICTCLAS2012、武大瀋陽老師的ROST CM等,這裡推薦初學者考慮用ROST-CM工具入手,分詞主要考慮是否可以使用者自定義詞典和剔除、詞性標註等。
少量語料的分詞比較簡單,但海量語料的分詞要有一定難度和資料處理能力。
特別強調:任何中文分詞如果能夠加入人工干涉和主觀判斷都會提升準確性和有效性;下面介紹的線上個性化分詞本身也可完成分詞。(包括中文分詞,體驗效果:不同語料和多少,時好時壞)
視覺化(Visualization)是利用計算機圖形學和影象處理技術,將資料轉換成圖形或影象在螢幕上顯示出來,並進行互動處理的理論、方法和技術。
它涉及到計算機圖形學、影象處理、計算機視覺、計算機輔助設計等多個領域,成為研究資料表示、資料處理、決策分析等一系列問題的綜合技術。目前正在飛速發展的虛擬現實技術也是以圖形影象的視覺化技術為依託的。
視覺化的意義
2、增強理解、便於對話、探索、交流。
3、簡化複雜性,增強審視。