首頁>Club>
我是一名大三的文科生,想將來從事於資料分析這一行業,所以想知道怎麼自學R語言?市面上書本教程很多,我也不會分辨,有同樣是文科生自學R語言的人嗎?希望有大神能夠幫忙解答
14
回覆列表
  • 1 # 購哈網

    如果想自學更快的話,先學習基本的語法,所謂的基礎性的語言規則,之後的話拿一些專案去實際的操作下就能夠更快速的學會掌握了,如果有更多相關的問題可以關注諮詢我!

  • 2 # 零財經

    什麼是R?R的優點何在?

    R是一個數據分析軟體。簡單點說,R可以看做MATLAB的“替代品”,而且具有免費開源的優勢。R可以像MATLAB一樣解決有關數值計算的問題,而且具有強大的資料處理,繪圖功能。

    R擁有大量的統計分析工具包,我的感覺是——只有我們沒聽說過的工具,絕對沒有R沒有的工具包。配合著各種各樣的工具包,你可以毀滅任何關於資料和統計的問題。因為資料包的數量龐大,所以查詢自己需要的資料包,可能很煩惱。

    如果有以下技能,學R會很方便:

    已經瞭解些高階程式語言(非常重要)

    英語不壞

    機率統計理論基礎

    看資料不頭疼

    看cmd or terminal 也不頭疼

    你需要一本適合你的R語言教材:R語言教程推薦

    (一)中文部分:

    R for beginnersR導論都有中文版,用其快速入門是相當不錯的。簡明參考卡片,是居家旅行必備的東西。統計學與R筆記,網路同好做的一個總結資料,相當的完整,不過不合適用來學習而應該作為參考查閱。統計建模與R軟體(推薦),薛毅老師的書相當精彩,中級統計和多元都有涉及,不僅對R的各種函式命令講解清楚,而且用基本程式設計方法來解決統計問題,非常有利於學習。多元統計分析及R語言建模,王斌會老師的書,是多元方面的R語言實現,略為簡單,現在出了第二版,如何可能的話還是去讀英文資料吧。環境與生態統計-R語言的應用,美國杜克大學錢松老師的書,統計思想講的很透徹,內容包括了初級中級高階三個層次內容,多重模型尤其出彩。(二)英文部分An Introduction to R: Software for Statistical Modelling & Computing,R官方站上的免費教程,錢松老師推薦為是最好的入門講義。Introductory Statistics with R,springer出版的佳作,入門推薦,整體簡潔清晰,講解常規方法比較細緻一些,除經典統計內容外還涉及到了生存分析,logistic迴歸和非線性擬合的內容。R in Action入門最佳),由Quick-R站長所著,分為三個層次講解的中級統計教程,排版精緻,講到很多較新的擴充套件包。Linear Models with R,關於經典線性模型的教材,講解有一定深度,需要有一定的機率統計基礎。Extending the Linear Model with R 線性模型的擴充套件,和上一本書是同一作者,公式較多,對廣義線性模型、加性模型、非線性模型等講解最為詳細。Applied Econometrics with R,是Use R!系列中的一本,為計量經濟學中之應用。Exploratory multivariate analsis by Example Using R,多元方面的書,較為簡潔,例子不錯。A Handbook of Statistical Analyses Using R(推薦),非常經典的中級統計(條件推斷、薈萃分析和麵板資料分析尤其出色)主要透過案例講解,基本沒有公式。Introductory time series with R,Use R!系列的另一本,用它來入門時間序列很不錯,如果要深入一些可以看time series analysis: with applications in R,這本書華章出了中文版。A first course in statistical programming with R,關於科學計算方面的R語言教材,入門水平。如果要更進一步可以去看Introduction to Scientific Programming and Simulation Using RR cookbook,菜譜式參考書,主題清楚方便查詢。另一本相關的是R graph cookbook,繪圖方面的必備參考書,以R語言基本繪圖命令為主,還涉及到headmap以及地理繪圖。Using R for Data Management, Statistical Analysis, and Graphics 統計函式手冊,容易查閱。Data Mining with R Learning with_Case Studies 用例子來講解資料探勘,有點難度的。如果能將這幾個案例全部照著做一遍應該會極有收穫。還有一本關於資料探勘的是Data Mining with Rattle and R,對於資料探勘的流程講解很好,偏向於使用R的一個擴充套件包rattle。R in Nutshell(推薦),果殼系列圖書之一,講解全面,索引非常有用。我將它全文打印出來放在桌頭參考。The R Book(推薦),公認的好書,極為全面,章節編排有序,由淺入深,包含內容很豐富。但此書排版不大好,另外出版時間較早,一些新的函式包沒有涉及。Data Analysis and Graphics Using R(推薦),綜合性的統計分析教程,沒有很多公式用用各種案例講解統計模型,覆蓋面和the R book不相伯仲,出版時間較近。Lattice Multivariate Data Visualization with R和ggplot2 Elegant Graphics for Data Analysis(推薦)這兩本都是關於R高階繪圖的教材,一個著重於lattice包,另一個著重於ggplot2包,前者學習入門較快,後者略有難度但潛力無窮。我這裡在說一下主要使用的幾本教材的心得:

    1. 統計建模與R軟體(薛毅著):非常優秀的R語言入門教材,涵蓋了所有R的基礎應用&方法,示例程式碼也很優秀。作為一本中文的程式語言教材,絕對是最優秀的之一。但是要看懂這本書,還是需要“已經瞭解些高階程式語言”。PS:我親愛的吉林大學圖書館,有兩本該教材流通,我常年霸佔一本。

    2. R in Nutshell:從講解內容上看,與上一本差別不大,在R語言的應用上都是比較初級的入門,但是有些R軟體&語言上的特性,寫得比薛毅老師的教材深刻。這本書最大的優點就是工具書,方便開始入門時候,對有些“模稜兩可”的東西的查詢。PS:我將這本書列印了出來,簡單的從頭到尾翻過,最大的用途就是像一本字典一樣查詢。

    3. ggplot2 Elegant Graphics for Data:這是一本介紹如何使用ggplot2包,進行繪圖的書。ggplot2包,非常強大的繪圖工具,幾乎可以操作任何圖中的元素,而且是提供新增圖層的方式讓我們可以一步步的作圖。提到ggplot2包,應該提到一個詞——“潛力無窮”,每一個介紹

    ggplot2的人,都會用這個形容詞。這本書最大的作用也是當做一本繪圖相關的工具書,書中講解詳細,細緻,每個小引數的變動都會配圖幫你理解。PS:這本書我也打印出來了,非常適合查詢。

    幾個可以逐步提高R能力的網站

    1.R-bloggers: http://www.r-bloggers.com/ 這裡有關於R和資料的一切討論,前沿的問題,基礎的問題,應有盡有。可以說這些傢伙們讓R變得越來越強大。我RSS了這個網站,每天都看一下有什麼我感興趣的方法和話題,慢慢的積累一些知識,是一個很有意思的過程。

    2.統計之都:http://cos.name/cn/ 這是一個有大量R使用者交流的論壇,你可以上去提問題,總有好心人來幫助你的。

    3.R客: 是關於R的一個部落格,更新不快,偏重國內R的一些發展。

    R的使用環境

    如果你看見terminal or cmd就打怵的話,一定要使用Rstudio。Rstudio的優點是,集成了Rconsole、指令碼編輯器、視覺化的資料查詢、歷史命令、幫助查詢等,還有的完美的指令碼和console的互動。畢竟是視覺化的介面,有許多按鈕可以用。R 的指令碼編輯器很蛋疼,就比記事本多了個顏色高亮吧,不適合編寫指令碼,但適合除錯指令碼。

  • 3 # 模型機器

    先對著《R語言資料科學》通讀一遍,把書上的程式碼都敲一遍。

    然後對著《R語言實戰》通讀一遍,把書上的程式碼都敲一遍。

    然後找個競賽網站,慢慢用R語言去解決問題。或者某Q加一些資料分析的群,試著解決一些問題。

    不要畏難,不要放棄。有一天,你突然就發現,自己好像不知不覺就會了。

  • 中秋節和大豐收的關聯?
  • 關於“龍生九子”,哪種說法更為準確?