你有沒有過這樣的體驗:
在淘寶上買了一幅裝飾壁畫,第二天你再開啟淘寶,發現推薦商品裡面全是家裝類的商品;
或者在網易雲上面聽了一首民謠,第二天網易雲又給你推了好幾首相同型別的歌;
是巧合,還是淘寶、網易雲在窺探你的生活?它們又是怎麼做到的?
這就要問問這些軟體背後的資料工程師們了。
1資料科學是什麼?資料科學(Data Science)是一個應運而生的新學科。
一家公司如果想要從這麼龐大的資料流中找出他們的潛在客戶以及顧客的消費趨勢等資訊,就要通過資料科學來進行分析。
比如說,美國20世紀90年代中期最大的零售商Target,在2008年的金融危機後完全輸給了競爭對手沃爾瑪,但是在2013年,該公司引入了一支優秀的資料分析團隊。
他們通過預測客戶的行為模式向顧客家裡郵寄相關產品的廣告,這樣就會比一股腦地把所有產品的廣告都塞給顧客要更精準,也能帶來更大的購買量。
於是奇蹟發生了,該公司2013年第三季度的銷售額比去年增長了5%以上,而在8月份,線上收入的增長率高達41%——這是該公司有史以來的最高增幅。
Target 圖片來源:Google
再比如說,Facebook的資料分析團隊會通過大資料來精準地判斷你的喜好,並通過你的喜好預測出一系列你的個人屬性資料,譬如對生活的滿意度、智力、情緒穩定性、性取向等等。
甚至,Google每天會從全球各地收到超過2800份簡歷,無法光靠HR一雙肉眼去把每一份簡歷都看過來,於是資料科學又起了作用,它可以通過關鍵詞的篩選從幾千份簡歷中把某個崗位最適合的候選人挑出來,大大減少了工作量。
資料使用的多樣化促使越來越多的行業和企業開始重視資料科學,於是一門新的學科誕生了,“資料分析師”也在最短的時間內成為了“二十一世紀最熱門的職業”。
2資料科學學什麼?目前資料科學還屬於新興的專業,並不是所有的大學都會開設這一專業。
根據Data Science Community的統計資料,美國共有611所大學開設資料科學相關專業,
但在這些大學中資料科學只作為電腦科學或商科的輔修專業,而不是一個獨立的學位,並且還有很多學校的資料科學專業是用線上教學的方式開設的。
根據Data Science 的統計資料,美國現有50餘所學校開設單獨的資料科學(Data Science)專業,
今年5月,美國資料科學人才測評專業機構Correlation One公佈了資料科學專業的世界大學排名,本科與碩士前10名的學校如下圖所示:
這些學校儘管都開設資料科學專業,但課程設定卻不盡相同,有些學校更偏向於統計學而有些學校更偏向於電腦科學,
比如,斯坦福大學資料科學專業的核心課程則是離散數學、概率分析、統計推斷導論和資料探勘;
卡內基-梅隆大學的資料科學專業核心課程是機器工程學、雲端計算和計算機程式設計等。
3還有什麼專業可以勝任資料科學家?其實看到上文大家應該就明白了,資料科學(DA)是一門交叉學科,它與電腦科學(CS)和統計學(Statistics)是分不開的。
因此在就業的時候,也並不是只有資料科學專業畢業才可以做資料科學方向的專業。
在美國招聘平臺Indeed上搜索資料科學家(Data Scientist)這個崗位,可以看到很少有公司要求求職者的學歷必須是資料科學專業,
原因之一就是上文中提到的,目前正經開設資料科學專業的學校數量並不多,原因之二是因為許多其他專業畢業的人才也可以勝任這個職位。
那麼資料科學方向的崗位更偏好什麼專業呢?這要先從資料科學方向到底包括哪些崗位開始說。
1point3acres(留學求職論壇)博主Warald將資料科學方向的工作大致分為以下三類:
機器學習工程師(Machine Learning Engineer)資料分析師(Data Analyst)資料科學家(Data Scientist)這三種職位的工作內容和難度各不相同。
舉個簡單的例子,在Indeed上分別搜尋資料科學家、機器工程師和資料分析師三個職位,任職要求中所列出的技能是有很大區別的。
對於資料分析師,用人單位一般只會要求一些基礎技能,對學歷的要求也不高,而資料科學家和機器工程師則各自需要掌握不同方向的專業技能。
資料分析師比較偏向基礎工作,類似於資料的提取和簡單分析,撰寫資料報告等,在分析層面上也沒有太高的要求,統計學專業或者學過統計學的其他專業就可以勝任;
機器學習工程師則偏向於技術崗,他們比資料分析師工作的含金量要再上一個層次,可能需要用到專業的建模軟體,或者編寫一些程式進行資料的清洗、歸納和分析,而根據具體職位要求的不同,機器學習工程師這個崗位更多招聘計算機專業、人工智慧專業的畢業生;
資料科學家則是最高難度的崗位,資料分析一定是用來支撐商務決策的,而不同的資料應該如何支撐決策?比如零售業需要用資料來預測購買趨勢和客戶需求,從而對產品的定價做出調整;而像ebay、淘寶、Amazon這種平臺則需要根據資料來調整推薦順序,這就需要資料科學家不僅需要熟悉各種複雜的分析軟體,還需要清楚地知道你所分析的資料是用來做什麼的。
因此資料科學家對於應聘者的學歷背景要求就更為嚴格,不光要有程式設計的知識、統計學的知識,而且還要有商科的思維。
但是,對這個職位心儀的人也不用因此望而卻步,不用覺得:那我豈不是要本科學計算機、碩士讀商科、博士學統計學才能當資料科學家?
資料科學家需要有這幾個方面的知識,但不用太深,譬如程式設計,資料科學家一定不需要像軟體工程師那樣,寫出能經得起測試的程式碼;也不用比市場部總監還了解市場,而是隻需要有一個全域性觀,能夠利用資料優化產品,為公司帶來利潤就夠了。
4資料科學家掙多少?根據美國諮詢公司麥肯錫釋出的報告,資料分析師的人才缺口會在2018年前達到140000-190000,今天,在LinkedIn上搜索“資料分析師”這個崗位,會跳出38,601條結果。
這個行業對於人才有著龐大的需求量,不光是IT行業需要大資料,像是零售業、金融保險業和傳統行業也早已開始使用資料分析——正如前文所言,我們生活在一個數據的時代,資料分析的興起只能是大勢所趨。
既然人才缺口大,企業想必就要通過提高報酬的方式吸引人才,那麼,資料科學方向的工作能掙多少?
工作型別
正如上文所說,資料科學方向的工作分為三大工種,既然他們所做的工作如此不一樣、門檻如此不一樣,那麼薪資也是必定有差距的。
根據美國薪酬調查機構Payscale的資料:
資料分析師的平均薪資為$59,504;
機器工程師的平均薪資為$112,431;
資料科學家的平均薪資為$96,073。
工作地點
雖然幾乎所有行業都需要資料科學類人才,但是就像軟體工程師一樣,大型網際網路公司是資料科學類職位的招聘主力,對比其他行業,IT行業的起薪也會更高。
因此網際網路公司聚集的加州或高科技產業區西雅圖,一定會比其他地區的起薪要高,而根據各地的消費水平不同,起薪也會有差距。
根據Indeed在全國範圍內的調查結果,資料科學家這一職位在加州的平均年薪為$144,330,比這一職位的平均年薪高出17%;
而在俄亥俄州的平均年薪為$111,046,比全國平均線要低10%。
5小結資料科學之所以能夠成為專業和就業的大熱門,是因為這個工作有無限的“可能性”。
它比軟體開發這種技術類的工作更需要大局觀,更需要對產品和市場的把握。
他們能夠發現問題在哪,能夠知道從何處下手去解決,並且還能自己製造工具去解決這個問題。
因此,資料科學類職業的前景比任何其他職業都要好,一個優秀的資料科學家,完全可以進入高階管理層,甚至走得更遠。
更多精彩內容請關注: