回覆列表
-
1 # IT人劉俊明
-
2 # python小白社群
作為在暴風,金山雲等公司大資料平臺工作實踐過的大資料架構師,來回答這個問題比較合適。
首先,作為適合學生和入門大資料的初學者,最方便的莫過於在自己本機能用“濃縮”的方式安裝部署一個實驗叢集。至少需要安裝namenode,如果做高可用實驗,還需要又一個備份的standby namenode,資料節點datanode也得部署上,還有yarn等需要的服務,要玩轉大資料叢集,至少8個以上的服務程式是需要同時執行在本地機上的。
具體的可看以下:
所以,建議機器配置中記憶體至少8G,條件好點16G最嘉。
至於硬碟,則是裝完作業系統,還需要剩餘50G磁碟空間來進行測試。所以建議120G磁碟及以上的最好。
CPU根據市面的標準配置就可以。
作為資料科學,學習的會涉及到機器學習和深度學習。深度學習可能會對gpu有需求,可以在購買的時候考慮下nvidea的顯示卡。
大資料專業的相關實驗對於電腦的記憶體要求比較高,即使是對於記憶體要求比較低的實驗性大資料平臺,往往也需要至少8G的記憶體空間,而如果想有一個較為流暢的使用體驗則需要更大的記憶體空間,所以記憶體一定要大一些,也可以說記憶體越大越好。
由於記憶體與其他裝置有所不同,通常的膝上型電腦在記憶體的支援程度上並不會有太大的擴充套件空間,而且記憶體本身還存在代差且無法相容,所以在選擇膝上型電腦的時候,儘量一次把記憶體空間升級到最大,這樣做既經濟又實用。
除了記憶體之外,還應該注重一下顯示卡的配置,原因是目前大資料與人工智慧的關係比較緊密,大資料專業的同學也難免會從事一些人工智慧方面的開發,其中關於機器學習(深度學習)和自然語言處理方面的開發就比較常見,而人工智慧的實驗通常會採用GPU完成計算,所以應該配備一個稍微好一點的顯示卡。當然,相對於記憶體越大越好來說,顯示卡並不需要太高的配置,畢竟實驗環境下,對於效率的要求並不算高。
相對於記憶體和顯示卡來說,大資料專業對於儲存空間的要求並不算高,當然如果要想有更快的執行速度,應該選擇固體硬碟,這樣也會便於攜帶。同樣,CPU的配置也沒有太高的要求,主流的配置,甚至是稍微低一些的配置都是可以的。
對於大資料專業的學生來說,在選購電腦的時候還需要考慮螢幕的大小和電池的續航時間,螢幕儘量大一些,而續航時間則至少應該保障4個小時。