回覆列表
  • 1 # 使用者52510796211

    簡單地說,資料探勘是從大量資料中提取或‘挖掘’知識。該術語實際上有點用詞不當。資料探勘應當更正確地命名為‘從資料中挖掘知識’,不幸的是它有點長。許多人把資料探勘視為另一個常用的術語‘資料庫中知識發現’或KDD的同義詞。而另一些人只是把資料探勘視為資料庫中知識發現過程的一個基本步驟。資料探勘是一個用資料發現問題、解決問題的學科。通常透過對資料的探索、處理、分析或建模實現。我們可以看到資料探勘具有以下幾個特點:基於大量資料:並非說小資料量上就不可以進行挖掘,實際上大多數資料探勘的演算法都可以在小資料量上執行並得到結果。但是,一方面過小的資料量完全可以透過人工分析來總結規律,另一方面來說,小資料量常常無法反映出真實世界中的普遍特性。非平凡性:所謂非平凡,指的是挖掘出來的知識應該是不簡單的,絕不能是類似某著名體育評論員所說的“經過我的計算,我發現了一個有趣的現象,到本場比賽結束為止,這屆世界盃的進球數和失球數是一樣的。非常的巧合!”那種知識。這點看起來勿庸贅言,但是很多不懂業務知識的資料探勘新手卻常常犯這種錯誤。隱含性:資料探勘是要發現深藏在資料內部的知識,而不是那些直接浮現在資料表面的資訊。常用的BI工具,例如報表和OLAP,完全可以讓使用者找出這些資訊。新奇性:挖掘出來的知識應該是以前未知的,否則只不過是驗證了業務專家的經驗而已。只有全新的知識,才可以幫助企業獲得進一步的洞察力。價值性:挖掘的結果必須能給企業帶來直接的或間接的效益。有人說資料探勘只是“屠龍之技”,看起來神乎其神,卻什麼用處也沒有。這只是一種誤解,不可否認的是在一些資料探勘專案中,或者因為缺乏明確的業務目標,或者因為資料質量的不足,或者因為人們對改變業務流程的抵制,或者因為挖掘人員的經驗不足,都會導致效果不佳甚至完全沒有效果。但大量的成功案例也在證明,資料探勘的確可以變成提升效益的利器。

  • 中秋節和大豐收的關聯?
  • 小米官宣:“米酒”已準備好,你怎麼看?