這兩個資料探勘工具都是IBM推出的。
Modeler注重資料流的處理,對資料處理的每一個步驟,都由一個節點來完成,一系列的節點就組成了對資料的處理、資料的建模、以及結果的呈現。所以,用Modeler的話你可以看得到整個資料分析和挖掘的整個步驟,因此Modeler應該可以實現多方合作分析,每個人都完成其指定的分析動作。
而Statistics類似於Excel,它只保留資料處理後的最終狀態(即處理後你就看不到原始的資料集了,而Modeler不會直接修改原始的資料集)。在分析能力上,各有優勢。比如說常用的偏相關分析、多因素方差分析、協方差分析,這些在Statistics中就有,但在Modeler中好像沒有見到;反過來,一些高階的模型比如SVM在Modeler中有,但在Statistics卻沒有實現。
所以,這兩個工具的好壞真不太好比較,功能有重疊,也各自有缺點,就看你習慣使用了。比如,我就習慣於Statistics,易學易用,而且可控性強。其實,工具的好壞要看你要解決什麼樣的問題,目前沒有哪一種工具能夠滿足所有的需求,所以有些時候,我們需要掌握多種分析和挖掘工具。
建議你可以先學Statistics,如果此工具無法解決問題了,再考慮學習其它的工具。反正,如果你弄明白了資料分析方法和資料探勘模型的原理,用哪個工具都基本一樣(只要它實現了)。
這兩個資料探勘工具都是IBM推出的。
Modeler注重資料流的處理,對資料處理的每一個步驟,都由一個節點來完成,一系列的節點就組成了對資料的處理、資料的建模、以及結果的呈現。所以,用Modeler的話你可以看得到整個資料分析和挖掘的整個步驟,因此Modeler應該可以實現多方合作分析,每個人都完成其指定的分析動作。
而Statistics類似於Excel,它只保留資料處理後的最終狀態(即處理後你就看不到原始的資料集了,而Modeler不會直接修改原始的資料集)。在分析能力上,各有優勢。比如說常用的偏相關分析、多因素方差分析、協方差分析,這些在Statistics中就有,但在Modeler中好像沒有見到;反過來,一些高階的模型比如SVM在Modeler中有,但在Statistics卻沒有實現。
所以,這兩個工具的好壞真不太好比較,功能有重疊,也各自有缺點,就看你習慣使用了。比如,我就習慣於Statistics,易學易用,而且可控性強。其實,工具的好壞要看你要解決什麼樣的問題,目前沒有哪一種工具能夠滿足所有的需求,所以有些時候,我們需要掌握多種分析和挖掘工具。
建議你可以先學Statistics,如果此工具無法解決問題了,再考慮學習其它的工具。反正,如果你弄明白了資料分析方法和資料探勘模型的原理,用哪個工具都基本一樣(只要它實現了)。