首頁>Club>
8
回覆列表
  • 1 # IT人劉俊明

    大資料是我的主要研究方向之一,目前也在帶大資料方向的研究生,所以我來回答一下這個問題。

    首先,大資料是一個比較典型的交叉學科,對於數學、統計學和計算機均有一定的要求,所以如果基礎比較薄弱,可以根據自身的實際情況選擇一個切入點。從專業學習的角度來說,基礎差也是可以學習大資料專業的。

    對於基礎比較差的學生來說,如果選擇學習大資料專業,需要注意以下幾點:

    第一:注重數學和統計學的學習。雖然大資料目前的產業鏈涉及到諸多崗位,有的崗位對於數學和統計學的要求並不高,比如資料採集、資料儲存、資料呈現等崗位,但是要想在大資料領域形成一個比較完整的知識結構,數學和統計學具有重要的意義。大資料主要的目的在於資料的價值化,資料價值化重要的方式就是資料分析(挖掘),而資料分析重點就在於演算法的設計和實現,所以數學和統計學對於大資料的學習非常重要。

    第二:注重動手實踐能力的培養。學習大資料一定要注重動手實踐能力的培養,一方面要熟練使用大資料平臺,包括大資料平臺的搭建、配置、元件部署等,另一方面要在大資料平臺上開發各種應用。目前適合初學者的大資料平臺包括Hadoop和Spark,程式語言可以選擇Java、Python、Scala或者R。

    第三:掌握常見的資料分析演算法。雖然大資料分析在不同的場景下往往需要採用不同的演算法,但是一些常見的演算法還是具有一定的通用性,比如kNN、決策樹、樸素貝葉斯、支援向量機、Apriori等,這些演算法在大資料分析領域有廣泛的使用,對於初學者來說也並不複雜。

    最後,學習大資料需要掌握的內容還是比較多的,這對於初學者的學習能力也有一定的要求,在學習的過程中,也要注重多交流。

  • 中秋節和大豐收的關聯?
  • 客廳適合掛什麼詩詞書法?