首頁>技術>

資料分析工具這麼多,應該用哪個來做分析?

這是很多人在做資料分析的時候,經常會碰到一個問題。尤其是新人剛入門的時候,看到下面的資料分析工具

Excel、sql、spss、python、tableau、powerbi、finebi、R、Hadoop、spark……

可能頭都大了,以為這些全部都要學。

在資料分析工具的選擇上,我的建議是對症下藥,因地制宜

根據資料應用的不同環節來看

其實看上圖就已經非常清晰了。每個資料分析工具都有其側重的功能點,在不同的資料應用場景下,選擇合適的工具,能實現效率最大化。

比如在資料獲取時,你可以透過SQL從資料庫中提取資料,也可以透過python爬取資料,但你最起碼要能熟練掌握SQL;

資料處理時,如果資料量不大,其實Excel是最方便快捷的資料處理工具,在大資料量的情況下,SQL和python的使用更為常見;在大量不可變資料的批處理作業中,hive則最為合適;

分析建模方面,簡單的分析,Excel、BI工具已經足夠,涉及到建模時,R、SPSS這類專業的統計分析軟體,就更能發揮出優勢,畢竟建模的思維和統計學是強相關的,當然,python也是一個不錯的選擇;

在做視覺化時,還是建議各位用專業的視覺化工具去做,視覺化工具的細分上也有很多,像普通的業務資料分析師和業務人員可以使用常見的BI工具tableau、PowerBI、FineBI等去做,報表工程師更適合選擇專業的報表工具例如finereport,開發人員還可以選擇一些開源的視覺化工具例如echart

3大常用工具分析

1、Excel

在很多人眼裡,Excel只是一個辦公軟體,但實際上,大部分人對Excel的認知還不到50%。Excel可以稱得上是最全能的資料分析工具之一,包括表格製作、資料透視表、VBA等等功能,保證人們能夠按照需求進行分析。

當然也有人認為自己非常精通計算機程式語言,不屑於使用Excel這種工具,因為Excel不能處理大資料。但換個思維想想,我們在日常中用到的資料是否超過了大資料這個極限呢?而且我們國家中小微型企業佔了大部分,Excel足夠處理絕大多數的資料分析需求。

總結一下,百萬級以下的資料處理、分析,Excel是個不錯的選擇,新人要是想學資料分析,Excel絕對是首選,而且是必選!

2、Python

不可否認的是,python在資料分析領域,確實稱得上是一個強大的語言工具。你可以隨心所欲地寫程式碼執行你想要的東西。儘管入門的學習難度要高於Excel和BI,但是作為資料科學家的必備工具,從職業高度上講,它肯定是高於Excel、BI工具的。

尤其是在統計分析和預測分析等方面,Python等程式語言更有著其他工具無可比擬的優勢。

新人在初入門時可以先不學Python,很多初級崗位甚至用不上Python,但如果想在這條路上長遠發展,它一定是個逃不開的工具。

3、BI工具

BI也就是商業智慧,這類工具就是為資料分析而生的。你會發現BI工具的產品設計,幾乎是按照資料分析的流程來設計的。先是資料處理、整理清洗,再到資料建模,最後資料視覺化,全程圍繞資料指導運營決策的思想。由於功能聚焦,產品操作起來也非常簡潔,依靠拖拉拽就能完成大部分的需求,沒有程式設計基礎的業務人員也能很快上手。

以FineBI為例

可以透過匯入資料集或者連線資料庫,獲取資料

最後,可以輸出下圖類似的視覺化儀表板,用作分析結果分享、報告都很適合。

以上的對比說明了幾個軟體的差別,我想總結的是,存在即合理。Excel\BI\程式語言,這些工具在應用上有交叉重疊的地方,也有互補的地方。對於重疊的地方,無論是哪種工具,只要你能利用它解決你遇到的問題,它就是最棒的。

10
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 翻譯:《實用的Python程式設計》01_03_Numbers