-
1 # 碼上程功
-
2 # 加米穀大資料
資料科學從一開始就是一個交叉學科,要求從業者在計算機、數學領域具備一定的技能,同時還要具備在同人與生意打交道的經驗。
資料科學家的主要目標是組織和分析大量資料,通常使用專門為此項工作而設計的軟體。資料科學家的最終資料分析結果應便於所有投資利益相關者理解,特別是便於那些非IT人員理解。資料科學家專注於前瞻,即做出預測,而資料分析師則更多地聚焦在回顧,如分析歷史資料。
怎樣學習資料科學,可以參考:
入行資料科學,這些書一定要看
https://www.toutiao.com/i6649627433530032653/
入門學習資料科學不能錯過的7類資源
https://www.toutiao.com/i6649627433530032653/
-
3 # 讀芯術
資料科學(DS)
簡單定義為:資料科學是從資料中提取有用知識的一系列技能和技術。
這些技能通常用德魯·康威(Drew Conway)創造的維恩圖(或它的變體)來表示:
三個圓圈分別代表三個不同的領域:程式設計領域(語言知識、語言庫、設計模式、體系結構等);數學(代數、微積分等)和統計學領域;資料領域(特定領域的知識:醫療、金融、工業等)。
這些領域共同構成了定義中的技能和技術。它們包括獲取資料、資料清理、資料分析、建立假設、演算法、機器學習、最佳化、結果視覺化等等。
資料科學彙集了這些領域和技能,支援和改進了從原始資料中提取見解和知識的過程。
什麼是“有用的知識”?就是可以具有某種價值、可以回答或解決現實世界中問題的知識。
資料科學也可以定義為:研究應用資料處理和分析方面的進展,為我們提供解決方法和答案的領域。
我們一起分享AI學習與發展的乾貨
-
4 # 興小星
早在 2009 年 1 月,Google 首席經濟學家 Hal Varian 就曾斷言,“能夠獲取資料 —— 能夠理解資料 —— 處理資料,從中提取價值,視覺化並傳達資訊,這將成為未來幾十年非常重要的技能……因為現在我們確實擁有基本上是免費和無處不在的資料。”
時下, 資料科學(Data Science)無疑是出國留學申請最為火熱的專業之一,隨著赴美國留學讀Data Science的學生越來越多,美國資料科學專業申請競爭也日趨激烈。那麼資料科學是什麼?學什麼?就業如何呢?小星為你一一道來
1、內容大綱
什麼是資料科學資料科學的核心技能資料科學學什麼資料科學就業如何美研資料科學申請要求資料科學選校推薦2、什麼是資料科學
2003年,《資料科學雜誌》曾提出:“所謂的‘資料科學’,指的是那些任何與資料相關的內容”。對此,我表示贊同,現在一切都無法與資料分割。
從最基本的角度來看,資料科學可以被定義為從資料中獲得任何有價值的東西。在現實中,資料科學發展如此迅速,而且呈現出巨大可能性,因此一個更廣泛的定義對於理解它是至關重要的。
如何從資料中獲得有價值的東西呢?不管是用統計學,還是用機器學習;不管是做資料分析,還是做資料探勘,都有可能達成這個目標。因此,具體問題需要具體分析。簡而言之,針對具體的問題,從業務-資料-特徵-演算法-應用這些角度切入,做出對的思考和行動。
3、資料科學的核心技能
我之前聽過一位斯坦福學長的課程,下圖是他提到的資料科學需要具備的技能,總結來說就是數理能力、資料分析能力、軟素質、溝通表達和視覺化的能力。
總結來說:
--要有獨立從各種各樣的地方把資料化為己用的能力;
你就會用到SQL、Programming、Hadoop/parallel processing、Machine Learning、Data Mining、Modeling等等。
--你不光要理解what users say they want,你還需要真正的理解what they actually mean;
--資料科學家會跟公司的很多不同部門的人打交道,會比碼農跟更有機會見到高層或者是 business領域的人,你需要知道區分什麼是問題本質、什麼是技術細節,要有能力給上層領導講high level的分析和推薦,有能力給同事講解和defend你的技術細節。
4、資料科學學什麼?
瞭解了資料科學家需要具備的能力之後,資料科學學什麼也就更加顯而易見了。
以下是紐大資料科學的課程
數學方面有:資料科學入門;機率統計;機器學習與計算統計;大資料這些課程
計算機方面有:自然語言處理與表示論;自然語言理解與計算語義;推斷與表示;深度學習;文字分析;自然語言處理等等。
5、資料科學就業如何?
美國企業與高等教育論壇(BHEF)與普華永道(PWC)近期釋出重要報告稱:
“資料分析的人才需求每年都在增長,而每年的高校畢業生數量遠遠無法滿足行業需求。” 報告顯示:只有23%的教育者認為畢業生會有資料分析技能,但69%的僱主都希望求職者真正具備資料分析技能。在 Glassdoor 2019年新發布的《50份最佳就業》報告(50 best jobs in America)中,“資料科學家”在各個職業中名列最佳工作,職業滿意度高,職缺多,且重要的是:薪水還很高。
著名求職網站 Indeed 今年 2 月的最新統計資料透露,全美平均資料科學家的平均年薪為 12 萬 7981 美元,像科技巨頭如 Facebook 等,薪資則會更高。
但是,儘管有這麼高的評價與薪資,資料分析領域還是很缺人!
2018 年 8 月 Linkedin 釋出的勞動力報告顯示,全美有超過 151,000 個數據科學家工作空缺,所有主要城市都出現短缺。其中,紐約、舊金山和洛杉磯出現“急劇”短缺。“資料科學家”的職位自2013年12月以來“飆升了344%”,職缺的速度甚至大於“軟體工程師”。
按照官方說法,美國勞工統計局甚至預測,到 2024 年,該領域的工作崗位將增加 11 個百分點。
6、美國資料科學申請要求?
美研申請一方面考察學生的學校,績點,語言成績,專業背景,另一方面會比較看重軟性背景,也就是相關實習和專案經歷。
專業背景方面,數學/統計或CS為佳,物理,經濟學等強調數學能力的專業次之,其他理工專業再次之。轉專業申請者,建議修過相關數學課程,如線性代數,機率論,數理統計,微積分等;計算機方面建議修過CS相關課程,如程式語言Python、R、Java、C++等。
以下是哥大DS專案官網的申請要求:
---哥倫比亞大學的MS in Data Science 專案處於美國資料科學碩士申請難度的第一梯隊。該專案為期1年,學生共需修讀30個學分,無需撰寫畢業論文。
---該專案要求申請者擁有一定的數學及程式設計基礎,最好學過微積分、線性代數、計算機程式設計等課程,沒有強制性的工作經驗要求,有的話也會為申請者加分。
---需要遞交GRE成績,託福100、雅思7.0,不可使用GMAT代替GRE成績。
7、美國資料科學選校推薦
哈佛大學
MS Data Science 1年
專業背景:自然科學,數學,或工程專業學士學位
不接受GMAT代替GRE,不接受IELTS代替TOEFL
哥倫比亞大學
MS in Data Science 2年
專業背景:定量課程 (微積分,線性代數等);計算機程式設計
斯坦福大學
M.S. in Statistics: Data Science 5 Quarters(1年3個Quarters)
專業背景:較強的數學和計算機背景
不接受GMAT代替GRE,不接受IELTS代替TOEFL
杜克大學
Master in Interdisciplinary Data Science (MIDS) 2年
每年大約招收25-35個學生
布朗大學
Master"s in Data Science
專業背景:先修課要求為1年的微積分,1學期的線性代數,1學期的機率與統計
喬治城大學
Master of Science in Data Science for Public Policy 2年
專業背景:大學本科微積分課程,成績為B級或以上,並展示技術能力的證據,如計算機科學、高階統計或高等數學課程。
南加州大學
Master of Science in Computer Science (Data Science)
專業背景:工程學、數學或硬科學。
不接受GMAT代替GRE
卡耐基梅隆大學
MSPPM Data Analytics track 1.5年
業背景:較強的數學基礎,有先修課要求
紐約大學
MS in Data Science 2年
專業背景:在數學、計算機科學和應用統計學方面有很強的背景。
不接受GMAT代替GRE
羅徹斯特大學
MS in Data Science 2學期
專業背景:科學、工程、數學或商業
回覆列表
資料科學也稱為資料驅動科學,是一個跨學科的科學方法,過程,演算法和系統領域,可以從各種形式的資料中提取知識或洞察力,既可以是結構化的也可以是非結構化。
資料科學是一個“統一統計,資料分析,機器學習及其相關方法的概念”,以便用資料“理解和分析實際現象”。它採用從數學,統計學,資訊科學和計算機科學等廣泛領域取得的技術和理論,特別是從機器學習,分類,聚類分析,不確定性量化,計算科學,資料探勘,資料庫和視覺化。
【關注ABC(A:人工智慧;B:BigData; C: CloudComputing)技術的攻城獅,Age:10+】