-
1 # 與世界對講
-
2 # 歡樂pets
數學模型就是把一個系統用公式代替(如車輛運動),但建立的模型往往不是十分精準,因此需要反饋來不斷修正現實中的系統;
機器學習說白了就是“學習”,就是用相當多的資料,不斷“訓練”,本質上就是改變“權重”;二者的相同是有輸入輸出,不同是機器學習需要大量資料訓練(黑箱),數學模型需要事先建立模型(有較強的理論基礎);
-
3 # 繁星落石
機器學習是數學建模的自動化實現。
雖然嚴格來講並非如此。機器學習演算法的目的,是為了尋找出輸入和輸出之間的數學表達關係,這種表達關係即為建模。但是機器學習的效能有限,它只能透過特定的演算法尋找特定的表達形式,不能自由地選擇表示式的組成。所以機器學習雖然算是數學建模過程,卻和人類建模過程並不相似。
另外一點,機器學習畢竟是靠資料說話的,所以可以透過複雜的網路結構,實現十分複雜的網路模型表達。這一點是人力所不能及的,光是那個引數的數量都會讓人望而生畏。
-
4 # HELIX人工智慧實驗室
傳統數學建模是我們在學校裡都學過的建模方法,該方法中,數學家們基於專家經驗和對現實世界的理解進行建模。而機器學習建模則是另一種完全不同的建模方式,機器學習演算法以一種更加隱蔽的方式來描述一些客觀事實,儘管人類並不能夠完全理解模型的描述過程,但在大多數情況下,機器學習模型要比人類專家構建的數學模型更加精確。當然,在更多應用領域(如醫療、金融、軍事等),機器學習演算法,尤其是深度學習模型並不能滿足我們需要清晰且易於理解的決策。
如果想在自己的資料集上嘗試使用解耦表示學習的方法,可以參考 Github 上關於解耦學習的分享,以及 Google Research 提供的關於解耦學習的專案程式碼。
1. 深度學習存在的問題
由於深度學習技術的發展,我們在許多領域都對神經網路的應用進行了嘗試。在一些重要的領域,使用神經網路確實是合理的,並且獲得了較好的應用效果,包括計算機視覺、自然語言處理、語音分析和訊號處理等。在上述應用中,深度學習方法都是利用使用線性和非線性轉換對複雜的資料進行自動特徵抽取,並將特徵表示為“向量”(vector),這一過程一般也稱為“嵌入”(embedding)。之後,神經網路對這些向量進行運算,並完成相應的分類或迴歸任務:
從特徵提取和準確度來看,這種 “嵌入”的方法非常有效,但在許多方面也存在不足:
可解釋性:嵌入所使用的N維向量無法對模型分析的原理和過程進行很好的解釋,只有透過逆向工程才能找到輸入資料中對分析影響更大的內容。
資料需求量龐大:如果只有 10~100 個樣本,深度學習無法使用。
無監督學習:大多數深度學習模型都需要有標籤的訓練資料。
零樣本學習:這是一個很關鍵的問題,基於一個數據集所訓練出的神經網路,若不經過重新訓練,很難直接應用在另一個數據集上。
物件生成:除了 GANs(生成對抗網路)以外,其他模型都很難生成一個真實的物件。
物件操作:難以透過嵌入調整輸入物件的具體屬性。
理論基礎:雖然我們已經掌握了比較通用的逼近理論,但這還不夠。
這些問題很難用機器學習框架來解決,但在最近,我們取得了一些新的進展。
2. 數學建模的優勢
在 20 年、50 年 甚至 100 年以前,大多數數學家都沒有遇到過上述問題。其中原因在於,他們主要關注數學建模(mathematical modeling),並透過數學抽象來描述現實世界中的物件和過程,如使用分佈、公式和各種各樣的方程式。在這個過程中,數學家定義了我們在標題中提到的常微分方程(ordinary differential equations, ODE)。我們透過對比深度學習存在的問題,對數學建模的特點進行了分析。需要注意的是,在下面的分析中,“嵌入”代表數學模型的引數,如微分方程的自由度集合。
可解釋性:每個數學模型都是基於科學家對客觀事物的描述而建立的,建模過程包含資料家對客觀事物的描述動機和深入理解。例如,對於物理運動的描述, “嵌入” 包括物體質量、運動速率和座標空間,不涉及到抽象的向量。
資料需求量小:大多數數學建模上的突破並不需要基於巨大的資料集進行。
無監督學習:對數學建模來說也不適用。
零樣本學習:一些隨機微分方程(如幾何布朗運動)可以應用於金融、生物或物理領域,只需要對引數進行重新命名。
物件生成:不受限制,對參進行取樣即可。
物件操作:不受限制,對引數進行操作即可。
理論基礎:上百年的科學基礎。
我們沒有使用微分方程解決所有問題的原因在於,對於大規模的複雜資料來說,微分方程的表現與深度學習模型相比要差得多,這也是深度學習得到飛速發展的原因。但是,我們仍然需要人工的數學建模。
3. 將機器學習與基於人工的建模方法相結合
如果在處理複雜資料時,我們能把表現較好的神經網路和人工建模方法結合起來,可解釋性、生成和操作物件的能力、無監督特徵學習和零樣本學習的問題,都可以在一定程度上得到解決。
對於微分方程和其他人工建模方法來說,影象處理很難進行,但透過和深度學習進行結合,上述模型允許我們進行物件的生成和操作、可解釋性強,最重要的是,該模型可以在其他資料集上完成相同的工作。該模型唯一的問題是,建模過程不是完全無監督的。另外,對於物件的操作還有一個重要的改進,即當我改變 ”鬍鬚“ 這一特徵時,程式自動讓整張臉變得更像男人了,也就是意味著,模型中的特徵雖然具有可解釋性,但特徵之間是相關聯的,換句話說,這些特徵是耦合在一起的。
下圖展示了使用其中一個單一特徵對心跳資料進行操作的過程,其中黑線代表心跳,使用的特徵資料值從 -3 逐漸增大至 3。在這一過程中,其他特徵始終保持不變。不難發現,第 5 個特徵對心跳形式的影響很大,第 8 個代表了心臟病的情況(藍色心電圖代表有梗塞症狀,而紅色則相反),第 10 個特徵可以輕微地影響脈博。
圖:對心電圖的心跳進行解耦
正如預期的一樣,金融資料的實驗效果沒有這麼明顯。模型的訓練引數設定與上一實驗相似。使用的資料為 2017 年收集的比特幣價格資料集,該資料集包含一個時間長度為 180 分鐘的比特幣價格變化資料。預期的實驗效果為使用 beta-VAE 學習一些標準的金融時間序列模型,如均值迴歸的時間序列模型,但實際很難對所獲得的表示進行解釋。在實驗結果中可以發現,第 5 個特徵改變了輸入的時間序列的趨勢,第 2、4、6 個特徵增加/減少了時間序列上不同階段的波動,或者說使其更加趨於穩定或動盪。
圖:對比特幣的收盤價格進行解耦
多個物件的解耦
假設在影象中包含多個物件,我們想要找出每一個物件的影響因素。下面的動圖展示了模型的效果。
上文的模型幾乎具備了數學建模的全部優質特性,也具有深度學習在分析複雜資料時的高準確度。那麼,如果能使用完全無監督的方式,從複雜資料中學習到如此好的表示結果,是不是意味著傳統數學建模的終結?如果一個機器學習模型就可以對複雜模型進行構建,而我們只需要進行特徵分析,那還需要基於人工的建模嗎?這個問題還有待討論。
回覆列表
數學模型可分為邏輯模型與非邏模型(即非線性模型),它包含了運用一切數理知識體系做出來的模型,運用非常廣泛。而演算法也是透過統計出來得出的一種模型,簡單點理解就是可以透過過去總結的經驗就可以得出一個模型,任行業只要需要電腦製作產品都離不開它,好比工廠用的smt晶片貼片機,它就是用神經網路做出來的一個模型。數學模型包含了機器學習,機器學習其實也有邏輯思維與非邏輯思維的模型之分!機器學習也是透過大量的高精度深層次演算法設計出來的!就可以解釋為什麼現在的演算法工程師職位很吃香了。