藉助 R,就可以對其他資料集輕鬆重複相同的操作。因為所有資料都是透過程式碼進行處理和研究,因此對新的資料集執行相同的操作也就輕而易舉了。使用 Excel 時,大多數操作都是透過滑鼠點選實現,雖然使用者體驗不錯,但對新的資料重複操作卻非常費時而枯燥。而 R 只需載入新的資料集,然後再次執行指令碼即可。
實際上,用程式碼操作也便於診斷並共享你的分析結果。使用 Excel 時,大多數的分析結果都基於記憶體(資料透視表在這裡,公式編輯器在另一個表格上 等)。而在 R 中,透過程式碼執行所有操作,一目瞭然。如果你在修正一個錯誤,你很清楚在哪裡操作,而如果你需要共享分析結果,只需複製貼上程式碼即可。在 線查詢幫助時,你能準確說明所用資料,並提出具體的問題。事實上,大多數時候,你線上提問時,人們都是直接貼出準確的程式碼,來解決你的問題。
R 中的專案組織更簡單。在 Excel 中,我要準備一系列表格,可能還要準備多個工作簿,然後適當命名,而且各 檔名不得重複。我的專案備註分別儲存在各個檔案中。我的 R 專案組織單獨設有一個資料夾,我處理過的所有內容都放在其中。清理資料、探索性圖表及模 型。這樣便於我理解和查詢,也為與我一起工作的其他人提供方便。當然,Excel 也能做到井井有條。我覺得 R 的簡潔性更便於使用。
上述幾點只能說是錦上添花,而並不是必不可少。在沒有這些功能之前,我也用了好幾年 Excel,你應該也一樣。現在,我想講講 R 和 Excel 真正的區別。我想說的是,除了以上那些花哨的小優勢之外,R 更適合用於資料分析。原因如下。
藉助 R,就可以對其他資料集輕鬆重複相同的操作。因為所有資料都是透過程式碼進行處理和研究,因此對新的資料集執行相同的操作也就輕而易舉了。使用 Excel 時,大多數操作都是透過滑鼠點選實現,雖然使用者體驗不錯,但對新的資料重複操作卻非常費時而枯燥。而 R 只需載入新的資料集,然後再次執行指令碼即可。
實際上,用程式碼操作也便於診斷並共享你的分析結果。使用 Excel 時,大多數的分析結果都基於記憶體(資料透視表在這裡,公式編輯器在另一個表格上 等)。而在 R 中,透過程式碼執行所有操作,一目瞭然。如果你在修正一個錯誤,你很清楚在哪裡操作,而如果你需要共享分析結果,只需複製貼上程式碼即可。在 線查詢幫助時,你能準確說明所用資料,並提出具體的問題。事實上,大多數時候,你線上提問時,人們都是直接貼出準確的程式碼,來解決你的問題。
R 中的專案組織更簡單。在 Excel 中,我要準備一系列表格,可能還要準備多個工作簿,然後適當命名,而且各 檔名不得重複。我的專案備註分別儲存在各個檔案中。我的 R 專案組織單獨設有一個資料夾,我處理過的所有內容都放在其中。清理資料、探索性圖表及模 型。這樣便於我理解和查詢,也為與我一起工作的其他人提供方便。當然,Excel 也能做到井井有條。我覺得 R 的簡潔性更便於使用。
上述幾點只能說是錦上添花,而並不是必不可少。在沒有這些功能之前,我也用了好幾年 Excel,你應該也一樣。現在,我想講講 R 和 Excel 真正的區別。我想說的是,除了以上那些花哨的小優勢之外,R 更適合用於資料分析。原因如下。
你可以把任何資料載入 R。資料的儲存位置或儲存形式並不重要。你可以載入 CSV 檔案,也可以讀取 JSON,或者執行 SQL 查詢,抑或提取網站。你甚至還可以在 R 中透過 Hadoop 處理大資料。
R 是一個完整的工具集,使用的是資料包。在分析資料時,R 比 Excel 更實用。你可使用 R 執行資料管 理、分類和迴歸,也可以處理圖片,並執行其他所有操作。如果機器學習是你的專業,那能想到的任何演算法都是小菜一碟。目前,R 可用的資料包 逾 5,000 個,因此無論你要處理什麼型別的資料,R 都能應付自如。
總之,Excel 是一款不錯的資料分析工具。我相信它能不負眾望完成所有任務。但是,如果你只有這一款工具,則會大大影響你的工作 效率。相比之下,R 更好用,而且提供的工具集模組更完整。而缺點在於不是非常易於上手,使用者一開始相對要花很多時間學習使用。如果堅持下去,就會有所收 獲,不僅對資料更瞭解,還提高了自己的能力。