-
1 # 芝士隊長
-
2 # Alice機器學習乾貨鋪
情感分析也稱為意見挖掘,是自然語言處理(NLP)中的一個領域,它試圖在文字中識別和提取意見
除了提取意見,還可以提取:
態度:發言者是表達了積極還是消極的意見
主題:正在談論的事情
意見持有人:表達意見的實體
有很多實際應用場景,例如:
社交媒體監控 品牌監控 客戶之聲(VoC) 客戶服務 員工分析 產品分析 市場研究與分析
實現情感分析的方法有很多種,可分為:
基於規則的,手動制定一些規則來執行情緒分析。
自動系統,依靠機器學習技術從資料中進行學習。
混合系統,結合了基於規則和自動的方法。
基於規則的: 這時需要定義一組規則,用於識別態度,意見主體等。
例如可以這樣做:
1. 定義兩個態度極性的詞列表(例如,諸如差,最差,醜陋等負面詞,和好,最佳,美麗等正面詞)。
2. 給一個文字 計算文字中出現的正面詞數。 計算文字中出現的否定詞數。
3. 如果正面詞出現的數量大於負面單詞出現的數量,則返回正面情緒,相反,返回負面情緒。否則,返回中立。
當然這個方法非常非常簡單,沒有考慮單詞如何在一個序列中組合的
自動方法 這種主要是依賴於機器學習技術。
情緒分析任務通常被建模為分類問題,可以使用 Naïve Bayes, Logistic Regression, Support Vector Machines, Neural Networks 等演算法。
Naïve Bayes:使用貝葉斯定理來預測文字的類別。
Logistic Regression:非常著名的演算法,給定一組特徵(X)的情況下預測值(Y)。
Support Vector Machines::非機率模型,將文字看作多維空間中的點,被對映到空間的不同區域作為不同的類別。
Neural Networks:用 RNN 等神經網路來處理 之前寫過一篇簡單的 怎樣做情感分析 https://www.jianshu.com/p/1909031bb1f2
我是不會停的蝸牛 Alice
回覆列表
眾所周知,現在是一個網際網路的時代,各種複雜的演算法實現各種智慧的功能,神經網路BP演算法,模糊控制,大資料演算法等等,然而,機器學習,如何進行情感分析呢,這就要從控制談起了,首先機器內部需要有各種樣本,相當於一個學習庫當機器透過感測器識別或者神經網路演算法對當前的物件進行識別,然後與學習庫進行相應的匹配,就可以做到情感類的分析,深度神經網路可以很好的分辨出反諷語氣的句子。