首頁>Club>
9
回覆列表
  • 1 # 聖漫修

    這就如同作家為什麼要先學會認字寫字一樣啊!不學會統計怎麼去處理好不容易收集來的資料?不處理資料,怎麼用這些資料去分析這些資料所代表的某件人事物的意義?!就好像你先統計你班級人數,再分別找出男女的人數,再找出男女各自的學習成績,最後統計分析出男女學習好壞所各自佔有的比例,最後得出男生學習好的多還是女生多?差生中男生多還是女生多?類似的。當然事物面越廣,計算複雜性也就越大!

  • 2 # 代教授

    資料科學家需要具備三項基本技能:數學與統計學、計算機科學、業務知識。數學與統計學是科學研究的基礎,計算機科學則提供儲存與計算工具。

  • 3 # 質量大資料

    在大資料技術飛速發展的今天,資料科學家(Data Scientists)在學術與工業界都產生巨大影響,那麼,什麼是資料科學家?資料科學家都要具備哪些技能呢?

    什麼是資料科學家?

    資料科學家是指能採用科學方法、運用資料探勘工具對複雜多量的數字、符號、文字、網址、音訊或影片等資訊進行數字化重現與認識,並能尋找新的資料洞察的工程師或專家(不同於統計學家或分析師)。一個優秀的資料科學家需要具備的素質有:懂資料採集、懂數學演算法、懂數學軟體、懂統計分析、懂預測分析、懂市場應用、懂決策分析等。

    資料科學家集技術專家與資料分析師的角色於一身,與傳統資料分析師相比:後者通常是利用企業的內部資料進行分析,以支援領導層的決策,而前者更多的是透過關注面向使用者的資料來創造不同特性的產品和流程,為客戶提供有意義的增值服務。

    為什麼要學習統計學?

    統計學是透過搜尋、整理、分析、描述資料等手段,以達到推斷所測物件的本質,甚至預測物件未來的一門綜合性科學。其中用到了大量的數學及其它學科的專業知識,它的使用範圍幾乎覆蓋了社會科學和自然科學的各個領域。

    幾十年來,統計學和計算機科學是互相平行的,互相造出了對方造出的一系列工具、演算法。但是直到最近人們開始注意到,計算機科學家所謂的機器學習其實就是統計裡面的prediction而已。因此這兩個學科又開始重新融合。

    純粹的機器學習講究演算法預測能力,而統計一直就強調“可解釋性”。而作為一個數據科學家,80%的時間你是需要跟客戶、團隊或者上司解釋為什麼A可行B不可行。如果你告訴他們,“我現在的神經網路就是能有那麼好的預測力可是我根本就沒法解釋上來”,那麼,沒有人會願意相信你。

    所有,學習統計學對資料科學家非常重要!

  • 中秋節和大豐收的關聯?
  • 推薦幾款狙擊類的單機遊戲?