1、分析工具:Excel、Tableau等屬於分析工具類;
2、分析語言:Python、R等屬於分析指令碼語言。
3.挖掘工具:像SPSS/SAS類就屬於挖掘工具。此類挖掘工具側重探索隱藏得比較深的業務知識和模式,挖掘工具側重於業務的影響因素分析、預測性分析等等,講究分析模型(比常規的分析方法要複雜),在分析模型中不見得有統計指標,而是模式。
常用的分析模型:影響因素分析(相關/方差/列聯分析)、資料預測模型(迴歸預測/時序預測)、分類預測模型(決策樹、神經網路、支援向量機等),當然還其它更多的模型,比如聚類、關聯等等。
理論上,高階的資料探勘工具也能夠實現統計分析功能,但坦白地說,用挖掘工具來做統計工具分析,其效率反而沒有統計工具高;而且操作比較複雜,視覺化功能也相對較差。
而且,當前絕大多數公司,都是在用Excel/SQL來做資料分析,可見他們並沒有什麼複雜的業務問題需要用到更高階的挖掘工具,簡單的工具已經足以勝任平時的業務資料分析了。實際上平時的工作中80%的業務資料分析都可以用Excel/SQL或BI工具來完成。
分析語言本身也可以看作是一種特殊的分析工具。只是這種分析工具與SPSS相比不一樣, SPSS只需要透過拖拉就能夠實現資料分析結果,但Python/R則需要透過寫指令碼寫程式碼的方式來執行分析,所以用Python/R做資料分析就比較複雜。
作為工具, SPSS中已經內建和封裝了很多常用的分析方法、分析模型,所以你不需要花太多的時間去弄明白是怎樣實現的,甚至你有時不需要知道資料公式和原理(如果知道的話就更好了),你只需要聚焦在業務層面,就可以實現業務資料分析,得到良好的分析結果。所以,使用工具的優點在於:簡單易操作,不需要掌握深奧的理論知識。
但是,正因為工具封裝了具體的實現過程,無法對分析模型進行修改或自定義,如果你們公司需要一些特殊的分析模型,或者需要對原有的模型進行修改或最佳化,而分析工具又不支援的話,那麼此時你就得要使用分析語言Python來實現自定義的分析流程了。
當你使用Python分析語言時,你就得必須瞭解分析模型的數學原理及實現過程,還得要掌握程式設計的一系列技能,才能夠勝任Python/R的分析工作。同時,你得花大量的時間在如何實現模型上,而無法真正聚焦在業務問題的解決上了。
所以,比起用分析工具,用Python的好處是可以任意修改或定製化模型、可以自動化實現分析流程,但壞處也是顯而易見的(分析複雜、週期較長、技能要求高)。你擁有了定製化,就失去了簡潔;你擁有了超強的功能,就增加了複雜度,此即有得就必有失了。
e��~��
1、分析工具:Excel、Tableau等屬於分析工具類;
2、分析語言:Python、R等屬於分析指令碼語言。
3.挖掘工具:像SPSS/SAS類就屬於挖掘工具。此類挖掘工具側重探索隱藏得比較深的業務知識和模式,挖掘工具側重於業務的影響因素分析、預測性分析等等,講究分析模型(比常規的分析方法要複雜),在分析模型中不見得有統計指標,而是模式。
常用的分析模型:影響因素分析(相關/方差/列聯分析)、資料預測模型(迴歸預測/時序預測)、分類預測模型(決策樹、神經網路、支援向量機等),當然還其它更多的模型,比如聚類、關聯等等。
理論上,高階的資料探勘工具也能夠實現統計分析功能,但坦白地說,用挖掘工具來做統計工具分析,其效率反而沒有統計工具高;而且操作比較複雜,視覺化功能也相對較差。
而且,當前絕大多數公司,都是在用Excel/SQL來做資料分析,可見他們並沒有什麼複雜的業務問題需要用到更高階的挖掘工具,簡單的工具已經足以勝任平時的業務資料分析了。實際上平時的工作中80%的業務資料分析都可以用Excel/SQL或BI工具來完成。
分析語言本身也可以看作是一種特殊的分析工具。只是這種分析工具與SPSS相比不一樣, SPSS只需要透過拖拉就能夠實現資料分析結果,但Python/R則需要透過寫指令碼寫程式碼的方式來執行分析,所以用Python/R做資料分析就比較複雜。
作為工具, SPSS中已經內建和封裝了很多常用的分析方法、分析模型,所以你不需要花太多的時間去弄明白是怎樣實現的,甚至你有時不需要知道資料公式和原理(如果知道的話就更好了),你只需要聚焦在業務層面,就可以實現業務資料分析,得到良好的分析結果。所以,使用工具的優點在於:簡單易操作,不需要掌握深奧的理論知識。
但是,正因為工具封裝了具體的實現過程,無法對分析模型進行修改或自定義,如果你們公司需要一些特殊的分析模型,或者需要對原有的模型進行修改或最佳化,而分析工具又不支援的話,那麼此時你就得要使用分析語言Python來實現自定義的分析流程了。
當你使用Python分析語言時,你就得必須瞭解分析模型的數學原理及實現過程,還得要掌握程式設計的一系列技能,才能夠勝任Python/R的分析工作。同時,你得花大量的時間在如何實現模型上,而無法真正聚焦在業務問題的解決上了。
所以,比起用分析工具,用Python的好處是可以任意修改或定製化模型、可以自動化實現分析流程,但壞處也是顯而易見的(分析複雜、週期較長、技能要求高)。你擁有了定製化,就失去了簡潔;你擁有了超強的功能,就增加了複雜度,此即有得就必有失了。
e��~��