-
1 # IT人劉俊明
-
2 # 清閒的帆船先生
大資料是比較熱門的一項程式設計科目,近年來有越來越多的小夥伴轉行學習大資料,這可以充分體現大資料的重要性。而大資料是綜合性的、複雜的程式語言,這也代表著學習大資料不像學java、web前端、Python那樣簡單好學,它是需要有一定的程式設計基礎的。這並不是代表著零基礎就不能學好,想學好大資料還是需要一定的方式方法的。
1.端正學習態度
不論你是有程式設計基礎還是沒有程式設計基礎,端正學習態度是每個學習大資料小夥伴都應該做到的,一定要戒驕戒躁。不要因為自己沒基礎,就輕言放棄。
2.瞭解學習java、Python程式設計基礎
前面我們也說過了,學習大資料是需要一定的程式設計基礎的,所以在學習大資料之前,小夥伴是需要了解學習java、Python等程式設計基礎的,等小夥伴瞭解了、學習了程式設計基礎,學習大資料相對來說會更容易接受一點。
3.尋找適合自己的學習方法
學習方法的重要性相信小夥伴都應該明白,好的適合自己的學習方法可以讓小夥伴事半功倍。適合別人的學習方法,不一定適合自己,自己還需要不斷的去嘗試,去探索,多和小夥伴進行交流,綜合各種學習思維,讓其變成自己的學習思維。
4.以用為學
小夥伴在學習大資料過程中,可以搜尋企業對大資料開發人才的技術需求,結合企業要求來學習大資料,可以有效的提高學習效率,同時還可以提升自身職業價值。
最後,想要快速入門大資料開發,要做到多學、多問、多練習,結合自身情況,尋找適合自己的學習方法更重要。
-
3 # 尚矽谷教育
零基礎當然可以參加大資料培訓了,本來大資料培訓的目的就是為了讓那些不會的人透過培訓學習掌握相關的大資料知識的,方便想要進入大資料行業發展的人能夠透過培訓快速的掌握相關工作需求的一些技能,從而實現自己進入這個行業發展的目的。
選擇大資料學習要注意下邊的幾點:
1、是否適合學習大資料
2、找一個靠譜的大資料培訓機構
3、學習要認真努力,多動手進行練習
4、學習課程中是否有大資料相關專案
大資料學習路線圖:
-
4 # 安徽新華高階技工學校
資料分析師需要的技能大致有這些:Excel、SQL、統計學及SPSS、Python/R等。建議從Excel開始,因為Excel是使用最多,也是最強大的資料分析工具,入門簡單,因為大部分人都接觸過Excel。
-
5 # 木頭
習大資料首先我們要學習Java語言和Linux作業系統,這兩個是學習大資料的基礎,學習的順序不分前後. Java 大家都知道Java的方向有JavaSE、JavaEE、JavaME,學習大資料要學習那個方向呢?只需要學習Java的標準版JavaSE就可以了,像Servlet、JSP、Tomcat、Struts、Spring、Hibernate,Mybatis都是JavaEE方向的技術在大資料技術裡用到的並不多,只需要瞭解就可以了,當然Java怎麼連線資料庫還是要知道的,像JDBC一定要掌握一下。 有同學說Hibernate或Mybites也能連線資料庫啊,為什麼不學習一下,我這裡不是說學這些不好,而是說學這些可能會用你很多時間,到最後工作中也不常用,我還沒看到誰做大資料處理用到這兩個東西的,當然你的精力很充足的話,可以學學Hibernate或Mybites的原理,不要只學API,這樣可以增加你對Java操作資料庫的理解,因為這兩個技術的核心就是Java的反射加上JDBC的各種使用。 Linux 因為大資料相關軟體都是在Linux上執行的,所以Linux要學習的紮實一些,學好Linux對你快速掌握大資料相關技術會有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大資料軟體的執行環境和網路環境配置,能少踩很多坑,學會shell就能看懂指令碼這樣能更容易理解和配置大資料叢集。還能讓你對以後新出的大資料技術學習起來更快。好說完基礎了,再說說還需要學習哪些大資料技術,可以按我寫的順序學下去。 Hadoop 這是現在流行的大資料處理平臺幾乎已經成為大資料的代名詞,所以這個是必學的。Hadoop裡面包括幾個元件HDFS、MapReduce和YARN,HDFS是儲存資料的地方就像我們電腦的硬碟一樣檔案都儲存在這個上面,MapReduce是對資料進行處理計算的,它有個特點就是不管多大的資料只要給它時間它就能把資料跑完,但是時間可能不是很快所以它叫資料的批處理。YARN是體現Hadoop平臺概念的重要元件有了它大資料生態體系的其它軟體就能在hadoop上運行了,這樣就能更好的利用HDFS大儲存的優勢和節省更多的資源比如我們就不用再單獨建一個spark的叢集了,讓它直接跑在現有的hadoop yarn上面就可以了。其實把Hadoop的這些元件學明白你就能做大資料的處理了,只不過你現在還可能對"大資料"到底有多大還沒有個太清楚的概念,聽我的別糾結這個。等以後你工作了就會有很多場景遇到幾十T/幾百T大規模的資料,到時候你就不會覺得資料大真好,越大越有你頭疼的。當然別怕處理這麼大規模的資料,因為這是你的價值所在,讓那些個搞Javaee的php的html5的和DBA的羨慕去吧。記住學到這裡可以作為你學大資料的一個節點。Zookeeper 這是個萬金油,安裝Hadoop的HA的時候就會用到它,以後的Hbase也會用到它。它一般用來存放一些相互協作的資訊,這些資訊比較小一般不會超過1M,都是使用它的軟體對它有依賴,對於我們個人來講只需要把它安裝正確,讓它正常的run起來就可以了。Mysql我們學習完大資料的處理了,接下來學習學習小資料的處理工具mysql資料庫,因為一會裝hive的時候要用到,mysql需要掌握到什麼層度那?你能在Linux上把它安裝好,執行起來,會配置簡單的許可權,修改root的密碼,建立資料庫。這裡主要的是學習SQL的語法,因為hive的語法和這個非常相似。Sqoop這個是用於把Mysql裡的資料匯入到Hadoop裡的。當然你也可以不用這個,直接把Mysql資料表匯出成檔案再放到HDFS上也是一樣的,當然生產環境中使用要注意Mysql的壓力。Hive這個東西對於會SQL語法的來說就是神器,它能讓你處理大資料變的很簡單,不會再費勁的編寫MapReduce程式。有的人說Pig那?它和Pig差不多掌握一個就可以了。Oozie既然學會Hive了,我相信你一定需要這個東西,它可以幫你管理你的Hive或者MapReduce、Spark指令碼,還能檢查你的程式是否執行正確,出錯了給你發報警並能幫你重試程式,最重要的是還能幫你配置任務的依賴關係。我相信你一定會喜歡上它的,不然你看著那一大堆指令碼,和密密麻麻的crond是不是有種想屎的感覺。Hbase這是Hadoop生態體系中的NOSQL資料庫,他的資料是按照key和value的形式儲存的並且key是唯一的,所以它能用來做資料的排重,它與MYSQL相比能儲存的資料量大很多。所以他常被用於大資料處理完成之後的儲存目的地。Spark它是用來彌補基於MapReduce處理資料速度上的缺點,它的特點是把資料裝載到記憶體中計算而不是去讀慢的要死進化還特別慢的硬碟。特別適合做迭代運算,所以演算法流們特別稀飯它。它是用scala編寫的。Java語言或者Scala都可以操作它,因為它們都是用JVM的。會這些東西你就成為一個專業的大資料開發工程師了,月薪2W都是小毛毛雨後續提高 :當然還是有很有可以提高的地方,比如學習下python,可以用它來編寫網路爬蟲。這樣我們就可以自己造資料了,網路上的各種資料你高興都可以下載到你的叢集上去處理。最後再學習下推薦、分類等演算法的原理這樣你能更好的與演算法工程師打交通。這樣你的公司就更離不開你了,大家都會對你喜歡的不要不要的。
-
6 # luo互聯之學無止境
1.基礎知識積累的重要性。大資料開發技術具有較高的複雜性和綜合性,因此,小夥伴在學習大資料開發技術過程中,要重視基礎知識的積累。2.要注重專案實戰案例練習。在學習過程中,小夥伴不要只注重基礎知識的積累,還需要加強專案實戰練習,在練習專案實戰過程中,透過綜合性的練習,可以讓小夥伴在練習過程中查缺補漏,讓小夥伴對大資料開發技術知識理解的更深刻。3.多交流,培養自身程式設計思維的重要性。小夥伴在大資料培訓班學習相關大資料開發技術知識的過程中,要不斷的交流,和別人交換技術意見,學習瞭解別人好的程式設計思路,慢慢培養自身程式設計思維。
回覆列表
這是一個非常好的問題,作為一名科研教育工作者,我來回答一下。
首先,大資料技術體系是非常龐大的,要想全面瞭解大資料技術需要一個系統的學習過程,而且還需要突破一系列學習難點,對於零基礎的初學者來說,要想實現快速入門,最為直接和有效的方式之一就是選擇一個切入點,然後基於應用場景來學習大資料技術。
大資料的應用場景非常多,不同的應用場景對於大資料技術的要求也有所不同,初學者可以基於自己的知識結構和所處的行業環境,來選擇一個適合自己的應用場景。大資料的行業應用無非有三大場景,其一是資料採集場景,其二是資料分析場景,其三是資料應用場景,可以結合具體的場景來制定學習規劃。
資料採集的應用場景非常多,很多行業領域在開展業務的過程中,都需要先完成資料採集任務,而資料採集領域的人才需求量也相對比較大,整個資料採集涉及到的環節也比較多,包括資料採集、整理和儲存三大部分。相對於資料分析和應用環節來說,資料採集的入門還是相對比較容易的,初學者可以從爬蟲開始學起,然後再逐漸展開和深入。
資料分析是大資料技術的核心之一,資料分析也是當前實現資料價值化的主要方式之一,所以學習大資料技術通常都一定要重視資料分析技術。資料分析當前有兩大方式,其一是統計學方式,其二是機器學習方式,這兩種方式的學習都需要一個過程,可以從基本的統計學知識開始學起,要重視資料分析工具的學習。
資料應用是大資料價值的出口,當前的資料應用目標有兩大類,其一是給決策者使用,其二是給智慧體使用,當前隨著大資料逐漸成為網際網路價值的一個重要載體,資料應用目標還將增加一個價值載體的分類。
最後,對於大資料初學者來說,不論選擇哪個學習場景,最好要能夠得到專業人士的指導,這對於提升學習效率有非常直接的影響。