-
1 # 教育踐行者
-
2 # 使用者曠朗無礙
我想問統計是不是資料?大資料就是綜合資料。取也並非取,舍也並非舍,有取必有舍,有舍必有取,找到自己就找到方向了!
-
3 # 遂寧月嫂肓兒嫂蘭花
統計做得那麼好,幹嘛要轉行,你只虛要提升自己,字一下計算機,程式設計序就,這兩樣你學一下,這些都會了,前途不可古量。
-
4 # 使用者2124079680906
說實話由於本人知識有限,這個行情不太清楚,但感覺現在是大資料比較吃香吧,建議可以轉行,先從比較熱門的點入手,發揮一下才智啊,祝快樂
-
5 # 交易齒輪
大資料現在這麼火,想往大資料方面發展,但是英文、數學不好的可以嗎?? 學習大資料該學哪些技術??大資料和程式設計師比哪個要好學點??等等。。。很多人學大資料的原因就是大資料找工作好找,薪資很高,,當然,為了這個原因也是可以的,畢竟這個時代就業壓力確實很大,為了一個好的工作學一門技術,,但是我想問下你,你的專業是什麼呢??對於計算機/軟體,你的興趣是什麼?是計算機專業,對作業系統、硬體、網路、伺服器感興趣?是軟體專業,對軟體開發、程式設計、寫程式碼感興趣?還是數學、統計學專業,對資料和數字特別感興趣。。
一、初識hadoop Hadoop可以算是大資料儲存和計算的開山鼻祖,現在大多開源的大資料框架都依賴Hadoop或者與它能很好的相容。 關於Hadoop,你至少需要搞清楚以下是什麼: Hadoop 1.0、Hadoop 2.0 MapReduce、HDFS NameNode、DataNode JobTracker、TaskTracker Yarn、ResourceManager、NodeManager 自己搭建Hadoop,請使用第一步和第二步,能讓它跑起來就行。 建議先使用安裝包命令列安裝,不要使用管理工具安裝。 另外:Hadoop1.0知道它就行了,現在都用Hadoop 2.0. 二、更高效的WordCount 首先,你得先學習SQL,訪問、查詢資料庫的基本語言還是要懂的。。然後SQL On Hadoop之Hive,Hive是資料倉庫工具,資料倉庫是邏輯上的概念,底層使用的是資料庫,資料倉庫的特點:資料全(海量)、穩定;所謂穩定,比如資料庫的資料經常要更新,而資料倉庫的資料是不會被更新,只會被查詢,所以說Hive適合做資料倉庫。最後就是了解hive的工作原理,學會Hive的工作命令。 三、把別處的資料搞到Hadoop上 四、把Hadoop上的資料搞到別處去 五、例項分析 六、實時資料 七、更新查詢資料 八、高大上的機器學習 完成了第一、二,說明你已經快步入大資料的行列了,寫的不好也請多一、初識hadoop
Hadoop可以算是大資料儲存和計算的開山鼻祖,現在大多開源的大資料框架都依賴Hadoop或者與它能很好的相容。
關於Hadoop,你至少需要搞清楚以下是什麼:
Hadoop 1.0、Hadoop 2.0
MapReduce、HDFS
NameNode、DataNode
JobTracker、TaskTracker
Yarn、ResourceManager、NodeManager
自己搭建Hadoop,請使用第一步和第二步,能讓它跑起來就行。
建議先使用安裝包命令列安裝,不要使用管理工具安裝。
另外:Hadoop1.0知道它就行了,現在都用Hadoop 2.0.
二、更高效的WordCount
首先,你得先學習SQL,訪問、查詢資料庫的基本語言還是要懂的。。然後SQL On Hadoop之Hive,Hive是資料倉庫工具,資料倉庫是邏輯上的概念,底層使用的是資料庫,資料倉庫的特點:資料全(海量)、穩定;所謂穩定,比如資料庫的資料經常要更新,而資料倉庫的資料是不會被更新,只會被查詢,所以說Hive適合做資料倉庫。最後就是了解hive的工作原理,學會Hive的工作命令。
三、把別處的資料搞到Hadoop上
四、把Hadoop上的資料搞到別處去
五、例項分析
六、實時資料
七、更新查詢資料
八、高大上的機器學習
完成了第一、二,說明你已經快步入大資料的行列了,寫的不好也請多多包涵。
-
6 # 黑眼歷史觀
統計學裡就有大資料方向的,所以根本不用轉。
需要好一點的電腦。
大資料可以說是統計學的基礎要求了,而大資料顧名思義就是大量資料的挖掘、統計分析,少說都要數萬資料才算大資料,這個資料量是用筆無法做到的,所以要藉助計算機的力量。
所以轉到大資料方向會涉及到一些統計軟體,乃至於計算機語言。
常用的統計軟體有SPSS、SAS、Excel、WPS等,其中SPSS被稱為傻瓜式操作的軟體,是使用方法最簡單的統計軟體之一,但是要收費【使用方法簡單的軟體,絕大多數是收費的,所以很多相關公司還是喜歡用免費軟體省錢,換來的是員工實際操作中更復雜一點】。Excel和WPS的功能比較簡單,適合一些初步的統計。
使用的計算機語言並沒有嚴格的限制種類,只要能夠寫出一串能夠運算資料得出想要的結果的程式碼就可以,比較常用的有R語言、Python、C語言、C++、Java、MATLAB等。其中Python會涉及到人工智慧,這幾年很火,而Java目前是全球排行第一的計算機語言。
值得一提的是,絕大多數計算機語言是免費的,而且有全球各地的人會向相關平臺上上傳自己的程式包,提供他人免費使用。如果做大資料的統計分析時有相關的、可靠的程式包,可以用三、四行程式碼就能解決問題,十分方便。
-
7 # IT人劉俊明
作為一名大資料行業的從業者,同時也是一名教育工作者,我來回答一下這個問題。
統計學作為大資料的三大基礎學科之一,本身與大資料的關係就非常緊密,所以統計學專業的學生進入大資料領域是非常容易的。從另一個角度來說,統計學、計算機和數學這三個學科本身就處在大資料領域當中。
大資料目前在行業領域的諸多落地應用當中,一個重要的內容就是進行資料分析,而資料分析本身需要大量依賴於統計學知識,所以很多人也經常說大資料就是統計學,雖然這種說法有些片面,但是也足以說明統計學在大資料中的地位。
目前在大資料方向的研究生培養體系當中,統計學專業也是重要的培養渠道,很多統計學專業的大資料研究生也具有非常強的創新能力。在近些年舉辦的各種研究生大資料比賽中,經常能夠看到統計學專業的研究生取得較好的名次。
統計學專業的學生如果未來想專業從事大資料相關崗位,應該重點關注以下幾個方面的知識:
第一:程式設計知識。大資料行業的諸多崗位都離不開程式設計,比如大資料開發、大資料分析都在一定程度上依賴於程式語言,所以熟練掌握一門程式語言是比較重要的。對於統計學專業的學生來說,可以重點關注一下R和Python,尤其是Python語言。
第二:大資料平臺知識。大資料行業對於大資料平臺的依賴是非常強的,大資料應用開發和大資料分析往往都需要基於大資料平臺來展開,所以應該重點學習一下大資料平臺知識。目前可以重點關注一下Hadoop和Spark,雖然這兩個平臺的可用性遠不如各種商用大資料平臺,但是這兩個平臺是開源的,可以學習到更多的細節。
回覆列表
隨著人工智慧時代的到來,大資料是IT行業運營的基礎,越早加入越能及早積累行業經驗,起始建議進入行業的大型公司進行觀摩學習,在這個過程中發現自己的興趣點優勢,培養在行業中發現問題解決問題的能力,在任何一個企業都需要發現問題解決問題的人才。只有你擁有發現問題解決問題的能力,無論你在何時何地都是佼佼者。