-
1 # 東風高揚
-
2 # 夏31210451
兩個東西。
1數學。最新的資料探勘方法都是基於統計機器學習和高階深層人工智慧模型或者各種變形態的神經網路的,需要啊紮實的數理統計和微分方程基礎。
2英語。一個國家的力量是微小的,各國都有新的研究進展,要加快學習速度互相促進,學習國外的先進成果,同時用英語把自己的成果用論文或演講呈現出來加強交流學習。
-
3 # 路人甲
我大學修的專業的軟體工程,大三的時候在南京某酒店行業企業做Java後端開發,在第一家企業實習的時候因為工作需要接觸了爬蟲「就是我們所說的資料採集」
自認為爬蟲是一個非常有趣的領域,於是開始花大量的業餘時間去研究爬蟲領域。
說來也巧,因為做爬蟲久了,手裡有很多的爬蟲採集來的資料,於是很多資料分析師就來找到了我,所以也是從那個時候我才慢慢的接觸資料分析。從接觸資料分析到成為資料分析師我用了差不多半年。下面我會與大家分享這些經歷。
如何成為資料分析師:這其實是一個非常大的問題,作為資料分析師我可能還沒有成為那種很厲害的人,也沒有能力跟大家說那種很高深的東西,所以我就與大家分享一下我是如何用半年成為資料分析師的,希望對大家有幫助。
我把資料分析簡單的分為這幾大塊:
資料採集、資料清洗、資料分析、資料視覺化
第一塊是資料採集,所謂資料採集並不是我們理解的資料爬蟲,尤其是我們在工作中遇到的資料很多都是來自系統內的資料,來自資料庫的資料來自日誌的資料。
但是這些資料維度是非常多並且複雜的,所以在分析前我們就需要把這些資料採集來。資料採集常用的手段有:SQL/Python,其中SQL是資料分析的必備技能,Python是加分項。
第二塊是資料清洗,採集來的資料一般是不規整的,欄位缺失或者有錯誤是常有的事情,如果我們不對這些資料進行清洗,分析出的結果就會出現各種異常。在資料清洗這一塊就需要用到一些簡單的統計學基礎。
有了前兩步做鋪墊,我們就可以進行第三步資料分析了。作為商業資料分析來說,資料分析最重要的是行業知識和邏輯思維能力,行業知識往往是透過在行業中的工作經歷來獲取的,當然作為學生也可以透過一些行業相關的資料報告和雜誌來獲得。
而邏輯思維能力,需要後天的不斷的鍛鍊,常見的鍛鍊方法是多看資料分析實戰相關的書籍,學習作者的思維方式;經常和小夥伴一起做頭腦風暴;對於一些工作生活中有趣的經驗主義的事情嘗試透過資料角度去解答。
最後,資料分析得出了結論往往不是文字所能表達的,我們可能想透過資料視覺化讓結論更加的容易理解,目前國內外的資料視覺化的產品也非常多,我常用的有:Echarts/Tableau/Excel/Python等。
如果你對以上四步都沒有什麼問題,我想你離資料分析師的道路就不遠了。
回覆列表
謝謝邀請。你說的應該是大資料分析師吧。現在大資料分析可以熱得不要不要的。從發展來看,大資料分析師很有前景的。但也並不是隨便一個公司就可以做大資料分析的。有幾個問題是做大資料要考慮的:大資料來源是否全面,分析什麼,誰來使用等等。當然如果能到能做大資料的公司,那薪水還是可觀的。要做大資料分析師,有一些東西是不得不學的,要不然,做不了分析師的,可能做的程式設計師,幫別人實現分析的結果而已。
第一:統計學知識。這是很大一部分大資料分析師的短板。當然這裡說的不是簡單的一些統計而已。而是包括均值、中位數、標準差、方差、機率、假設檢驗等等具有時間、空間、資料本身。差不多應該是理工科的高等數學的知識,甚至還高一點兒。要能夠建模,要不然你分析出來的結果離實際相差十萬八千里的話,估計要不了幾天,你就會被捲鋪蓋走人了。當然,做個一般的大資料分析師,就不會涉及到很深的高等數學知識了,但要做一個牛B的大資料分析師,還是要學習學習再學習。
第二:很多人想不到的,你還是把EXCEL玩熟悉吧。當然不需要掌握的高大全,也得要掌握常用的函式,比如重點包括但不限於sum,count,sumif,countif,find,if,left/right,時間轉換,透視表,各種圖表做法等之類的。如果資料量不算是特別大的話,Excel能夠解決很多問題。比如,篩選部分贓資料,排序,挑選滿足條件的資料等等。
第三:分析思維的練習。比如結構化思維、思維導圖、或百度腦圖、麥肯錫式分析,瞭解一些smart、5W2H、SWOT等等那就更好了。不一定要掌握多深多全,但一定要了解一些。
第四:資料庫知識。大資料大資料,就是資料量很多,Excel就解決不了這麼大資料量的時候,就得使用資料庫。如果是關係型資料庫,比如Oracle、mysql、sqlserver等等,你還得要學習使用SQL語句,篩選排序,彙總等等。非關係型資料庫也得要學習,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起碼常用的瞭解一兩個,比如Hbase,Mongodb,redis等。
第五:業務學習。其實對於大資料分析師來說,瞭解業務比了解資料更重要。對於行業業務是怎麼走的對於資料的分析有著非常重要的作用,不瞭解業務,可能你分析的結果不是別人想要的。
第六:開發工具及環境。比如:Linux OS、Hadoop(儲存HDFS,計算Yarn)、Spark、或另外一些中介軟體。目前用得多的開發工具Java、python等等語言工具。
總之,要做一個高階或總監級的大資料分析師那是相當的燒腦的。要學習瞭解的東西如果只是單純的資料方面的話,那業務和統計知識的學習是必不可少的。如果是實用型的大資料分析師可能只掌握某些部分就可以。大資料開發工程師的話,基本就是掌握開發環境、開發語言以及各種圖表的應用,也是可以滿足的。畢竟,一個公司要團隊協作,一人懂一部分就可以搞出分析產品出來了。認定一項事情就去幹!越幹越輕鬆,越幹越牛B!