-
1 # 低熵製造機
-
2 # 萬法不空
老習慣,先說結論:作為一個IT老臘肉,簡單地說總結下,資料分析是基礎,而機器學習是建立在資料分析上的高層應用。
這兩個概念都是當前熱門專門的學科,而機器學習更是炙手可熱。在大學裡需要一個學期甚至更多的時間的學習,我們儘量用大白話做個介紹,讓大家理解這兩個概念是什麼東西。
第一、資料分析是個老概念,所以我們先說資料分析
簡單地說,資料分析師為了發現建立資料和資料之間的關聯,並尋找資料之間的關係。運用無所不在。
比如你說你要做“健康與家庭”的課題,你就要建立定義健康和家庭的資料,如健康的概念很泛,你需要定義的東西很多,比如環境、工廠、氣候、飲食、當地經濟狀況等等,都跟健康有關,而對於家庭,你需要定義家庭構成、家族病史、飲食、生活習慣工作環境和性質等等,然後你需要去手工建立關聯去尋找他們之間的關係,比如居住在工廠附近的居民是不是患病率更高等等。
說的學術一點:資料分析是指用適當的統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支援過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。
第二,再來說機器學習
簡單的說,是機器透過各種模型來自發的去探索和理解資料之間的關係,比如上面在資料分析裡,資料分析只能按照你定義的關聯,去尋找工廠附近的居民是不是患病率更高,而機器學習可以根據你定義的模型要去依次尋找患病率和居住環境、生活環境、經濟水發展水平之間的關係。
機器學習可以重新組織資料,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使計算機具有智慧的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演繹。
如果你想做好機器學習,資料分析是必須要熟練掌握的,常用的資料庫管理、SQL語句、各種正規化等等,如果想深入學習的話,機率論、統計學等理論也是必須要學的。
回覆列表
資料探勘和機器學習都植根於資料科學。 它們經常相互交叉或者相互混淆, 但是兩者之間有一些關鍵的區別。 下面我們來看看資料探勘和機器學習之間的區別, 以及如何使用它們。
資料探勘和機器學習之間的一個關鍵區別就是它們是如何在我們的日常生活中使用和應用的。
資料探勘可以用於各種目的, 比如金融研究, 投資者可能會利用資料探勘和網路搜尋來檢視初創企業的財務狀況, 並幫助確定他們是否願意提供資金。 一家公司也可以使用資料探勘來幫助收集銷售趨勢的資料, 從市場營銷到庫存需求, 以及確保新的線索。 資料探勘可以用來梳理社交媒體檔案、網站和數字資產來收集關於公司理想的資訊, 從而開展外聯活動。 使用資料探勘可以在10分鐘內帶來10000條線索。
機器學習也體現了資料探勘的原理, 但不同點是它可以自動生成資料的相關性, 自動從中學習出新的演算法。 這是自動駕駛汽車背後的技術, 它可以在駕駛過程中迅速適應新的環境。
機器學習可以觀察模式並從中學習, 以適應未來事件的行為, 而資料探勘通常是被用作機器學習的資訊來源。 雖然資料探勘可以被設定為自動查詢特定型別的資料和引數, 但它不能自己學習和應用知識, 而不需要人際互動。 資料探勘也不能自動看到現有的資料片段與機器學習所能達到的深度之間的關係。
資料探勘是機器學習的主要基礎之一。 資料探勘可以用來提取更精確的資料。 這最終有助於改善你的機器學習, 以實現更好的結果。而機器學習技術可以極大地拓展資料探勘能夠解決的問題集。