回覆列表
  • 1 # 西線學院

    1、基本的計算機知識和統計知識

    資料庫+SQL語言

    一些常用的資料庫如Oracle、SQL Sever、DB2、MySQL,這些資料庫或者說日常接觸的資料庫都要有所瞭解,懂最常用的就好,最重要的還是要會寫SQL。

    數學/統計學知識

    一些基本的數學統計方法如描述性統計、多元統計分析、迴歸分析等,重要性不言而喻。

    資料探勘知識:方差分析、迴歸分析、因子分析、聚類分析等等。這些東西作為入門多多少少都要會一些,雖然有可能不會全用到,但一旦用時方恨少。

    資料分析可視工具

    資料分析視覺化工具很寬泛。首推Excel,中小公司很依賴,熟練使用資料透視表,這是必備技能。中大型公司都是用報表工具或者BI來做報表,但有了SQL+Excel的基礎,這些工具上手都很快。

    2、業務知識

    資料分析師要與公司的各業務打交道,所以對於各部門的業務知識要有深入的瞭解。某業務領導需要知道某個指標,你需要知道這個指標由哪些資料構成?資料統計的口徑是什麼?資料怎麼取出來?這個指標對於行業的意義是什麼,處於什麼範圍分別對應什麼樣的情況,是好還是壞。然後慢慢摸索這個指標層面多維度的規律,如何設定最合理。

    明確自己的位置,快速成長

    附上網上的一張資料分析師能力體系圖,用於參考。

    資料分析是一向比較專業的工作,要時刻警惕自己能力是否有提升,目前是什麼樣的水平,習慣反思自己:

    2、這些資料是真實的嗎?採集和整理過程中會不會出現什麼問題?技術上的邏輯和業務上的邏輯是不同的概念,有沒有技術上沒有瑕疵,但並不符合業務邏輯的資料流程?

    3、到你手裡的資料經過了什麼處理?你又做了什麼處理?為什麼他們和你要做這些處理?

    4、誰需要你的資料?你處理後的資料流向哪裡?他們用資料做什麼?這些資料最終又拿去做了什麼?比如,為客戶做了什麼服務,公司釋出了什麼內容,或向管理層證明了什麼KPI,或支援了哪個部門的評估?

    5、你做整理的週期是什麼?為什麼是這樣的週期?

    6、公司有其他的部門在處理其他的資料嗎?是什麼樣的資料?和你有什麼關係?為什麼這些資料要分開處理?

    7、近一年,你自己的電腦上應該已經積累了不少資料,試試做個分析,從一段較長的時間來看,你負責的這一塊資料發生了什麼變化?為什麼會有這個變化?和公司的產品、經營、業務有關,還是和行業有關?具體怎麼有關?

    如何進一步提升?

    業務上

    1.業務為核心,資料為王

    瞭解整個產業鏈的結構

    制定好業務的發展規劃

    瞭解衡量的核心指標

    有了資料必須和業務結合才有效果

    需要懂業務的整體概況,摸清楚所在產業鏈的整個結構,對行業的上游和下游的經營情況有大致的瞭解。然後根據業務當前的需要,指定發展計劃,從而歸類出需要整理的資料。最後一步詳細的列出資料核心指標(KPI),並且對幾個核心指標進行更細緻的拆解,當然具體結合你的業務屬性來處理,找出那些對指標影響幅度較大的影響因子。前期資料的收集以及業務現況的全面掌握非常關鍵。

    2.思考指標現狀,發現多維規律

    熟悉產品框架,全面定義每個指標的運營現狀對

    比同行業指標,挖掘隱藏的提升空間

    拆解關鍵指標,合理設定運營方法來觀察效果

    爭對核心使用者,單獨進行產品用研與需求挖掘

    業務的分析大多是定性的,需要培養一種客觀的感覺意識。定性的分析則需要藉助技術、工具、機器。而感覺的培養,由於每個人的思維、感知都不同,只能把控大體的方向,很多資料元素之間的關係還是需要透過資料視覺化技術來實現。

    3.規律驗證,經驗總結

    發現了規律之後不能立刻上線,需要在測試機上對模型進行驗證。

    技能上

    1.Excel是否精鑽?

    除了常用的Excel函式(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達圖等)和簡單分析技能也是經常用的,可以幫助你快速分析業務走勢和異常情況;另外,Excel裡面的函式結合透視表以及VBA功能是完善報表開發的利器,讓你一鍵輕鬆搞定報表。

    2.你需要更懂資料庫

    常用的資料庫如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語句的熟練使用,對於資料庫的儲存讀取過程也要熟練掌握。在對於大資料量處理時,如何想辦法加快程式的執行速度、減少網路流量、提高資料庫的安全性是非常有必要的。

    3.掌握資料整理、視覺化和報表製作

    資料整理,是將原始資料轉換成方便實用的格式,Excel在協同工作上並不是一個好工具,報表FineReport比較推薦。專案部署的Tableau、FineBI、Qlikview一類BI工具,有沒有好好培訓學習,這些便捷的工具都能淡化資料分析時一些重複性操作,把精力更多留於分析。

  • 2 # 跟大牛學技術

    第一階段linux+搜尋+hadoop體系

    Linux基礎→shell程式設計→高併發架構→hadoop體系→HDFS→mapreduce→hbase→zookeeper→hive→lucene搜尋→solr/solrcloud→elasticsearch分散式搜尋→CM+CDH叢集管理→impala→oozie→flume→sqoop

    第二階段機器學習

    R語言→mahout

    第三階段storm流式計算

    kafka→storm→redis

    第四階段spark記憶體計算

    scala程式設計→spark core→spark sql→spark streaming→spark mllib→spark graphx→專案實戰四→python機器學習→spark python程式設計

    第五階段雲計算平臺

    docker→kvm→openstack雲計算

    當然每個階段找一些合適的專案練手是必須的, 可以鞏固相關知識點,瞭解其作用及相關的應用問題等等。

    對於自制力差的人,自學是一件很痛苦的事情,建議找到資深有名的老師來輔導你,可以讓你快速學會技術

  • 3 # IT人劉俊明

    大資料是我的研究方向之一,所以我來回答一下這個問題。

    大資料是一個典型的交叉學科,涉及到計算機、數學、統計學、軟體、金融學、社會學等學科的綜合運用。很多大學可以說是舉全校之力來開設大資料專業,可見大資料專業涉及到的內容有多廣。概括來說,學習大資料要學習以下重點內容:

    第一,數學。大資料的核心是資料分析,資料分析的核心是演算法,所以紮實的數學基礎對大資料的學習是非常重要的。《演算法導論》往往是大資料專業學生的必讀書籍之一。

    第二,統計學。大資料分析需要用到大量的統計學知識,大資料的出現對統計學來說也是一次重要的變革。現在很多統計學專業的研究生都以大資料為主要研究方向,未來的統計一定以大資料為基礎。

    第三,計算機。大資料與計算機的關係非常緊密,目前大資料人才大部分都是出自計算機相關專業。大資料的學習要搭建大資料平臺,比如Hadoop、Spark,另外需要具備作業系統、資料庫、程式語言等計算機基礎知識。

    大資料的學習是一個漫長的過程,由於大資料涉及到的內容非常多,所以如果能一邊使用一邊學習效果會更好一些。在掌握了基本的大資料知識以後,可以參加到一個大資料專案組實習,透過使用來促進學習,這是一個比較好的學習途徑。

    如果有大資料方面的問題,也可以諮詢我。

  • 中秋節和大豐收的關聯?
  • 如果出現大通漲,應該怎樣理財?