搞計算機的說的machine learning可以算是統計學的一個分支,是用計算機的方法來
來專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。machine learning的過程一般是如下:
把資料拆分為訓練集和測試集
用訓練集和訓練集的特徵向量來訓練演算法
用學習來的演算法運用在測試集上來評估演算法 (可能要設計到調整引數(parameter tuning), 用驗證集(validation set)
在這過程中最最重要的是機器學習演算法,我下面簡單分個類,運用機器學習演算法來迴圈上面的步驟。
1,透過分析大量資料和標籤的監督學習
2,只通過分析大量資料的非監督學習
3,透過分析大量資料和少量標籤的半監督學習
4,透過自己不斷總結經驗來實現目標的 強化學習
(規劃機器的行為準則方面)將計算機丟到一個對它完全陌生的環境或者完成一項從未接觸過的任務。它自己會嘗試各種手段,最後讓自己成功的適應這個環境或者學會完成這項任務的方法途徑。所謂強化學習就是智慧系統從環境到行為對映的學習,以使獎勵訊號(強化訊號)函式值最大,強化學習不同於連線主義學習中的監督學習,主要表現在教師訊號上,強化學習中由環境提供的強化訊號是對產生動作的好壞作一種評價(通常為標量訊號),而不是告訴強化學習系統RLS(reinforcement learning system)如何去產生正確的動作。由於外部環境提供的資訊很少,RLS必須靠自身的經歷進行學習。透過這種方式,RLS在行動-評價的環境中獲得知識,改進行動方案以適應環境。
5,透過優勝劣汰來不斷提高質量的 遺傳演算法
模擬熟知的進化理論,淘汰弱者,適者生存,透過淘汰機制去選擇最優的設計或模型
所以說它的優勢就是結合了目前計算能力的提升,大資料理論與實踐的成熟,資料集的豐富,演算法的不斷改善,以及人們實踐需要有交叉性的學科來解決一系列的資料問題。
上圖是基於python的機器學習模組。
搞計算機的說的machine learning可以算是統計學的一個分支,是用計算機的方法來
來專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。machine learning的過程一般是如下:
把資料拆分為訓練集和測試集
用訓練集和訓練集的特徵向量來訓練演算法
用學習來的演算法運用在測試集上來評估演算法 (可能要設計到調整引數(parameter tuning), 用驗證集(validation set)
在這過程中最最重要的是機器學習演算法,我下面簡單分個類,運用機器學習演算法來迴圈上面的步驟。
1,透過分析大量資料和標籤的監督學習
2,只通過分析大量資料的非監督學習
3,透過分析大量資料和少量標籤的半監督學習
4,透過自己不斷總結經驗來實現目標的 強化學習
(規劃機器的行為準則方面)將計算機丟到一個對它完全陌生的環境或者完成一項從未接觸過的任務。它自己會嘗試各種手段,最後讓自己成功的適應這個環境或者學會完成這項任務的方法途徑。所謂強化學習就是智慧系統從環境到行為對映的學習,以使獎勵訊號(強化訊號)函式值最大,強化學習不同於連線主義學習中的監督學習,主要表現在教師訊號上,強化學習中由環境提供的強化訊號是對產生動作的好壞作一種評價(通常為標量訊號),而不是告訴強化學習系統RLS(reinforcement learning system)如何去產生正確的動作。由於外部環境提供的資訊很少,RLS必須靠自身的經歷進行學習。透過這種方式,RLS在行動-評價的環境中獲得知識,改進行動方案以適應環境。
5,透過優勝劣汰來不斷提高質量的 遺傳演算法
模擬熟知的進化理論,淘汰弱者,適者生存,透過淘汰機制去選擇最優的設計或模型
所以說它的優勢就是結合了目前計算能力的提升,大資料理論與實踐的成熟,資料集的豐富,演算法的不斷改善,以及人們實踐需要有交叉性的學科來解決一系列的資料問題。
上圖是基於python的機器學習模組。