首頁>技術>

R語言資料清洗

資料是我們論文所有結果的與結論的基石。科研工作中,用事實說話,其實就是用資料說話。資料的地位可見一斑。然而我們平時在處理資料時總會遇到下面的情況:

遇到這些問題的時候,相信你一定不是在Excel裡一個一個改吧?

這些資料問題往往會導致我們的結果不能直接用於後續的資料分析或者視覺化。因此在分析之前,我們需要對其進行合適的“清洗”。

而R語言就是這樣一門為資料科學而生的計算機語言,R在資料清洗方面顯著優於SPSS、SAS等傳統統計軟體,面對現實資料中常見的問題,R語言都可做到靈活處理。

一、R語言核心基礎內容課程首先給大家介紹了R語言入門的基礎知識,主要給大家演示了R語言下載安裝,工作環境的搭建,重點概念介紹:包、函式、向量等,以及基本變數型別介紹還有一些條件和迴圈函式。

R語言安裝及環境搭建

R語言常用函式

R語言中向量命名規則

二、利用R語言預處理資料接下來課程介紹瞭如何利用R語言對資料進行處理,對於單個變數來說,主要的處理操作有:排序、查重、查缺、補缺、篩選、變換、切分。對於多個變數的處理有:追加、合併、批次運算、結構變換。

而我們需要考慮的就是什麼時候我們需要用到上面的的操作來處理資料,以及上面這些處理方法中,哪個方法最適合。這些你都可以在課程中找到答案。

三、分類變數處理對於連續型變數的離散化處理,我們用到ifelse、cut函式,計數用到的是扁平化表格,table、xtabs函式,改變因子水平需要用到forcats包。

四、字串處理簡單操作:貼上、切分

複雜操作:匹配、查詢、替換、提取

五、

資源領取方式

12
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 如何透過完善的策略,成功實現資料遷移?