5年經驗的大資料工程師告訴你，小白該如何快速成長

首頁>科技>大資料三十四號2019-10-11 22:48

資料科學是一個廣泛而模糊的領域，這使得它很難

學習。沒有動力，你最終會中途停止對自己失去信心。

你需要些東西來激勵你不斷學習，即使是在半夜公式已經開始變的模糊，你還是想探究關於神經網路的意義。對於小白學習大資料需要注意的點有很多，但無論如何，既然你選擇了進入大資料行業，那麼便只顧風雨兼程。正所謂不忘初心、方得始終，學習大資料你最需要的還是一顆持之以恆的心。

在實踐中學習

學習神經網路、影象識別和其他尖端技術是很重要的，但大多數資料科學工作不涉及這些：

90%的工作將是資料清理。

精通幾個演算法比知道一點許多演算法要好。

如果你知道線性迴歸、k - means聚類和邏輯迴歸,可以解釋和詮釋他們的研究結果,並可以用這些完成一個專案，你將比如果你知道每一個演演算法,但不使用它們更優秀。

所有這些意味著最好的學習方法是在專案工作中學習，通過專案，你可以獲得有用的技能。學習而不應用的知識很難被保留，當你做實際的工作的時候也不會準備好。

學會溝通

資料科學家需要不斷展示他們的分析結果。這個過程可以區別資料科學家的水平。

交流的一部分是對主題的理解和理論，另一個是理解如何組織你的結果。最後一部分是能夠清楚地解釋你的分析。

向同行學習

你根本想不到你會從同行身上學到多少東西，在資料工作中，團隊合作非常重要。

不斷增加學習的難度

你完全熟悉這個專案的工作了? 你最後一次使用一個新概念是在一週前? 那麼是時候做些更加困難的挑戰了。如果你停止攀登，那麼不進則退。

如果你發現自己太舒適,這裡有一些建議:

處理更大的資料集。學習使用spark。

看看能不能讓你的演算法更快。

你將如何將演算法擴充套件到多個處理器?你能做到嗎?

理解更多的理論演算法並使用。這會改變你的假設嗎?

試圖教一個新手去做你現在正在做同樣的事情。

上面這些這至少是一個思路告訴你在開始學習資料科學的時候到底要做什麼。如果你完成了這些，你將發現你的能力自然而然就提升了。