首頁>技術>

如果你有python入門基礎,在考慮資料分析崗,這篇文章將帶你瞭解:資料分析人才的薪資水平,資料人應該掌握的技術棧。

首先來看看,我在搜尋資料分析招聘時,各大廠開出的薪資:

那各大廠在資料領域,偏好哪些崗位呢?

要集中在大資料分析師、資料管理專家、大資料演算法工程師、資料產品經理這些崗位,在各個大廠的招聘需求中最常見到,而且開出的薪資待遇非常誘人。

如今大資料工程師人才高度稀缺,在工作年限相同的前提下,大資料工程

師的薪資普遍更高,待遇漲幅也高於其他崗位,現在入局大資料,是個不錯的選擇。

各大網際網路公司都在高價搶奪資料人才,為了謀求長期發展、獲取高薪,很多人也在考慮轉行大資料領域。作為專業性極強的一個領域,轉行如何學?學習重點在哪裡?很多人不知道。

我很早之前就認同一個觀點:一個優秀的資料人應該是思維、業務、分析和工程能力的綜合體,談思維、業務等能力很多人可能覺得飄在空中。確實,在我一開始接觸資料行業的時候,我也有這樣的感覺,為什麼那些大佬老是跟我吹產品Sense、業務感等等。

我們就拋開這些,就說工程能力,再具體一點,說說資料人應該掌握的技術棧。

1.關於精通python

雖然入行幾年,但我仍不敢說自己精通Pytho。我只是熟悉Python語法,相關的函式、模組和包以及一些面向物件的寫法等等。

想要成為合格的資料人,我覺得更重要的是去思考哪些問題可以利用Python擴充套件而來的一些程式庫處理,比如遇到大型矩陣的數值計算問題,你就應該想到Numpy來解決。

同理我會問,那Pandas呢?其實Pandas和SQL幾乎是一致的資料處理方式,都只是提供了快速便捷地處理資料的函式和方法,這也是Python為什麼會經常會被認為可以高效應用於資料分析原因之一了。

2.再說下資料架構

有些小夥伴應該是瞭解HiveSQL的,但如果要他說說Hive這類的問題,可能就有困難了,這樣其實是學不紮實的表現。

簡單來說,Hive是一個基於Hadoop的開源資料倉庫工具,用於存(HDFS)和處理(MapReduce)海量結構化資料。使用MapReduce計算,HDFS儲存。

雖然很多資料分析崗位不必精通Hadoop、MapReduce、HDFS,但是不代表不需要了解和學習,基礎是要打好的,而且Storm、Hbase、Flume、Spark、SparkSQL等等都是需要資料分析、資料探勘、資料演算法等崗位去學習和了解的。

Python不同方向核心資料下載

如果你想從事資料開發,那以上提到的技術棧是你應該熟練掌握的。(我個人建議是沒有專案經歷和工作經驗的不要輕易轉資料分析,因為真的HC少,可以考慮資料開發,很吃香,工資也高,競爭相對演算法和分析來說要小)

3.有必要學點資料探勘模型

某些業務場景的任務是不能用對比、交叉等分析解決的,例如分類、預測、文字挖掘等。

我之前提到說資料分析一般可以分成定量和定性的分析,定量的大家都比較清楚,也比較常見,但是定性的會去研究使用者的主動反饋意見,而這些一般都是文字,當資料量較大的時候,肯定不是一條條自己去分析使用者的情感、觀點等維度,這時候完全可以利用文字挖掘的方法快速準確的抽取出使用者觀點、主題和情感分析等等。

看到現在越來越多的人入行/轉行網際網路,我來說說我對這個領域的理解吧。

從業人員(除了高層)一般年齡在45歲以下,思維活躍、年輕,不像傳統行業等級森嚴,工作起來是比較愉悅的。任何人能入行這個領域,是因為網際網路對於沒有資源和背景的普通人是很包容的,比如它創造的很多新的工作機會,有些崗位之前是沒有的,因此不強求專業對口、要多少年的經驗等等,對於沒有資歷的普通人來說,網際網路很友好。

最重要的一點是,網際網路行業能和你適合的行業相結合,比如網際網路+金融、網際網路+餐飲,網際網路成為了一種業務模式,貫穿到了很多行業,在此基礎上去賺錢。

未來,網際網路會越來越滲透到各個行業,未來10年也必定是人工智慧、萬物互聯的時代。這也是我為什麼看準python的原因,因為python的優勢,就是對資料的處理。如果你也跟我一樣看好網際網路,看準python,那就利用好現在的時間,有效率的學習。我一直相信,生活會回報每一個為目標努力的人。

14
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 「Python」爬取TapTap原神評論並生成詞雲分析