回覆列表
  • 1 # 不只是設計

    視野決定了境界和能力,而所處的環境又決定了視野。好多人不知道什麼是資料分析師,認為會熟練使用Excel就是資料分析師,如果你還會使用Excel中的一些高階功能如透視和函式等等,可能別人就認為你是牛*的資料分析師了,如果你工作中還用到了VBA,(word天啊!),在別人眼中你就是資料分析大神了。真的是這樣嗎?誠然,單用Excel的確可以解決大部分的資料問題,但是作為一個數據分析師,你並不是一個基層的統計分析從業者,那麼資料分析師應該是怎樣的職業呢?

    (一)資料分析師的職場之路

    圖1:資料分析職位分類

    資料分析的職位分類按照資料處理的不同階段分為資料採集、資料分析、與資料探勘三種。其中資料採集的概念是對企業來說的,是jacky企業(航航資料)在做的事,包括原始資料來源的採集和地理資訊資料的採集,這裡受眾面太窄,就不一一說了,想了解的朋友可以私信我。

    下面主要說下資料分析和資料探勘的職位:

    大家要記住一句話:資料分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉升途徑,包括下面章節要說的資料分析的學習規劃也跟這兩個方向緊密相關。

    1、業務方向

    大家在招聘網站中搜索資料分析的職位,大概分為兩類:輔助業務的資料分析職位和資料分析師職位。

    1)輔助業務的資料分析:一般在零售業裡職位設定較多,該職位一定要對業務爛熟於心,對業務有長時間的積澱和理解,用資料發現業務流程中的問題,並提出合理化的解決方案,分析資料是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。

    2)資料分析師:業務方向的資料分析師,該職位招聘時一定前面有一個限定詞,什麼資料分析師,歸結起來分為三類:產品資料分析師,運營資料分析師和銷售資料分析師。

    2、技術方向

    技術方向主要指資料探勘方向,分為三類:資料探勘工程師(機器學習)、資料倉庫工程師(構架師)和資料開發工程師。在網際網路和金融行業崗位設定較多

    普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。

    (二)資料分析從業者需具備的核心能力

    我認為,資料分析從業者要具備四種核心能力:1、基礎科學的能力;2、使用分析工具的能力;3、掌握程式語言的能力;4、邏輯思維的能力

    圖2:資料分析核心能力體系

    1、基礎科學的能力

    可以說,在資料決策的時代,資料分析幾乎滲透到企業的每個業務環節中,行業資料分析報告更是淋漓滿目,釋出報告的有的是世界500強企業,有的是知名的資料洞察諮詢公司,jacky做為第三方資料評估機構的從業者,在看到視覺化效果越來越絢麗的同時,我也憂心忡忡,大多數的資料分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。

    統計學,數學,邏輯學是資料分析的基礎,是資料分析師的內功,內功不紮實,學再多都是徒勞。

    掌握統計學,我們才能知道每一種資料分析的模型,什麼樣的輸入,什麼樣的輸出,有什麼樣的作用,開始我們並不一定要把每個演算法都弄懂。

    如果我們要做資料探勘師,資料能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,模組也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉升。

    2、使用分析工具的能力

    資料分析工具:SQL、SPSS、SAS、R、EXCEL等等吧,都必須掌握並且會應用,畢竟企業需要的不是學者而是應用型人才。

    3、掌握程式語言的能力

    不會Python、不會R,說你懂資料分析誰都不信。

    4、邏輯思維的能力

    邏輯思維對於資料分析來說特別重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業資料裡,大家可以理解為去搭建商業框架或者說是故事線,有邏輯的推進,結果才會另人信服。

    1)提出假設

    2)驗證假設(統計方法)

    3)取數(SQL / Hive / Spark)

    4)清洗和整理資料(R / Python Pandas / PySpark)

    5)視覺化(Excel / R ggplot2 / Python matplotlib)

    6)展示給非技術人員(PowerPoint / Tableau / iPython Notebook / R Markdown)

    (三)2017,資料分析學習規劃

    任何一門技術或學科都有其內部規律,需要有計劃,有先後,循序漸進來學,jacky跟大家分享下潤祿資料學院的一些經驗:2017,資料分析的學習規劃(因個體差異,僅供參考)

    下圖:橙色區域代表資料採集板塊,藍色區域代表資料分析板塊,綠色區域代表資料探勘板塊。

    圖3:資料分析學習規劃(從入門到中級)

    1、統計學(業務方向)與SQL(技術方向):首要必會技

    任何資料分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助SPSS或其他SAS來學,做到資料分析基本功紮實,兼顧實戰性。

    任何資料分析師從事技術方向的工作都必會SQL,不單是資料分析師,每一個運營、產品經理、尤其是網際網路行業,一定要會SQL,基本知名網際網路公司的產品經理都能寫SQL。

    學習中,要掌握SQL的基礎語法、中級語法和常用函式,結合關係資料庫系統(Oracle Database、SQL Server、DB2等)來學習SQL語句,找好方法,真的不難。

    2、Python與R:不分伯仲,都要掌握

    Python主要掌握基礎語法,pandas操作、numpy操作、sklearn建模,學會用python編寫網路爬蟲爬取資料,等等。

    R語言就是為了統計而存在的語言,我們要掌握R語言的基礎語法、資料管理、資料探勘建模與評估等。

    以上是我們第二階段要學的技能。

    3、資料視覺化

    有了Python、和R的基礎,我們可以就可以學習資料可視化了。運營和產品都需要學習視覺化,視覺化說白了,就是畫圖,但做為資料分析師來說,我們不能用EXCEL 來實現視覺化,因為它的侷限性太大了。這裡也不建議花太多時間學習給非專業人士展示的Tableau,有1個小時學會Tableau足夠。

    Python中視覺化的工具有matplotlib,seaborn,ploltly;

    R中視覺化工具有plot基礎庫、ggplot2

    隨心所欲,用Python和R,你就知道做資料分析工作是多麼爽一個事

    4、資料探勘

    這裡知道要掌握基本概念,知道資料探勘時做什麼的,知道它與資料分析相比有什麼不同

    5、監督學習、非監督學習、模型評估

    Model建模,知道模型建好後應該怎樣去評估,掌握怎樣用一些定量的指標,資料,數值來衡量模型建好後到底有多準確,或者說到底有多錯誤。模型評估的指標或計算方式選擇正確與否,能夠直接影響到整個專案獲模型是否有效。

    6、以上這些只是資料分析的入門,還有... ...

    機器學習,文字與自然語言處理,分散式計算工具SPARK.... ...

    資料分析的路上,你準備好了嗎?2017,跟我一起,來逆襲吧

  • 2 # nnnnnuan

    跟大家分享一個職場小白上路的視覺化分析工具。

    先簡單介紹下工具:BDP個人版是一款免費使用、免安裝下載的資料視覺化分析工具,透過簡單的拖拽欄位,呈現各種精美的視覺化圖表,資料”小白“也能很快上手。

    註冊或登入:可以用手機號或郵箱註冊,免費使用;

    3、處理資料(工作表):

    進入BDP後,整個頁面可以分為3個大區:工作表管理、資料處理,以及工作表預覽。這種設計方式,非常方便使用者對工作表進行管理。在工作表管理區域,我們可以新增和檢視工作表,或對工作表的結構進行管理。選擇每張工作表後,可以在右側檢視具體的資料資訊。右上角集中了各種資料處理方式,主要分為對這張工作表進行處理和使用這張工作表進行進一步操作。

    4、拖拽製圖(視覺化分析):現在開始編輯圖表,拖拽不同的欄位進行資料分析,選擇你想要的圖表型別,另外還可以對字進行篩選、顏色等設定。可以透過30多種視覺化圖表直觀展示分析結果。

    在“編輯圖表”處,將資料拖到維度、數值欄,即X軸和Y軸,再根據需求進行視覺化分析~資料分析:BDP為了讓使用者拋棄繁雜的函式公式,對資料分析進行了更高級別的處理。你只需在數值欄處選擇分析方式,有求和、計數、平均值等常見計算,也有同環比、留存率、重複率等高階計算。我覺得這一點非常實用。視覺化:為了讓生成的圖表更加美觀,BDP提供各式視覺化圖表,有普通圖表和經緯度地圖,經緯度地圖我覺得是一個很高階的功能,所以放特色功能來講。普通圖表除了常見的柱圖、條形圖、折線圖等,還有一些稍高階的圖表,如瀑布圖、詞雲、漏斗圖、行政地圖、樹圖、桑基圖等。下面分享一個矩形樹圖:

    5.資料報表(儀表盤)

    資料製作成圖表後,會統一地展示在儀表盤,我稱之為”資料報表“,這樣好理解一些。先展示一個好看的資料報表,是BDP工具提供的示例。

    (來自BDP的示例報表)6.特色功能儀表盤分享:資料報表做好後,如果想要分享給領導或同事,只需點選右上角“分享”即可,且分享的資料結果可以實時更新。(注:私密分享是金鑽會員才能用)經緯度地圖:拖拽就能生成經緯度地圖,確實很簡單,也很有特色,上次製作出來的熱力地圖還被老闆誇了,開心,BDP有熱力地圖、氣泡地圖、統計地圖、海量點、軌跡地圖和動態軌跡地圖6種。Excel外掛:為了省去人工分析時間,實現資料實時同步,同步Excel本地資料,Mac和Window都支援。(圖片來自功能更新日誌)圖表聯動、多層下鑽圖表聯動:圖表聯動功能可以將某個圖表作為篩選器,點選其中某一個數據項,與其關聯的圖表將會篩選出所選項的資料內容,快速又直觀。(解釋出自BDP幫助文件)例如上圖,我在左側各地區銷售額中點選“華東”,在右側就會顯示出相應的銷售額曲線。多層下鑽:下鑽是透過增加圖層從彙總資料深入到細節資料進行觀察。透過逐層下鑽,讓我們對資料更加一目瞭然。例如上圖,我想要知道“器具”在“上海”地區的銷售額,那麼只要點選“器具”—“華東”—“上海”,就能馬上得出資料啦~END,希望對您有所幫助。

  • 3 # 帆軟軟體

    大家都知道我一直專注於資料分析領域,在知乎上面也發表了些資料分析方面的文章,帶動了不少有這方面想法的小夥伴想進入資料分析領域。

    現在有不少資料方面的"小白",來自運營、產品,大家學習資料的切入卻選擇了學習類似Python這樣的程式語言。這樣的想法確實讓我感覺有必要發文一篇,以免更多的朋友南轅北轍、誤入歧途。

    我一直認為各行各業的同學都應該具備一定的資料分析能力,哪怕你不是或者也不準備做一名資料分析師。原因在於資料分析是一種思想,是一種高效且行之有效的認識這個世界的能力。

    即便你本人並不做資料分析師,一旦具備了這種思想和能力,也能夠讓你在自己的領域看的更高、更遠、更透徹。而類似Python這樣的程式語言是一門工具,也僅僅是一門工具而已。即便掌握了這門工具,也並不代表你掌握了資料分析的思想和能力。

    更何況,這樣的工具對於非IT領域的同學來說過於繁瑣,學習成本是非常高的。這也是為什麼要選擇FineBI這樣的工具作為資料分析的工具,因為FineBI足夠簡單,上手夠快,並能夠支撐資料分析的一般需求,更重要的是我們的課程是要教給大家資料分析的思路和想法,工具學習成本越低越好。(a.我曾見到過的一個數據科學家,只會用Sql+excel做模型,他幫助公司收入增長了300%,3個億。注意只會sql+excel,但是他的分析思路和高度是我所佩服的;b.我見到過太多太多python,學到一半沒有實際應用場景而放棄的,也見到過學會了python入門,但不知道如何運用到工作因此浪費時間的。這裡並不是指python不好,而是我建議先入門,入門之後,再根據業務場景去學語言工具,會python肯定是資料分析師的主流,但並不是入門的好工具。)

    所以,我給大家的建議是:首先,大家應該將精力集中於資料分析思路的培養和訓練上,多去看一些商業資料模型和資料分析案例方面的資料,結合自己的工作場景和特點,形成自己的資料分析思路;

    其次,學習一個上手最簡單的資料分析工具,利用已有的資料和自己的分析思路進行分析,形成看板或者結論;最後,重點鍛鍊一下自己演講和PPT的製作能力。

    要知道,一個優秀的資料分析結論,也需要有好的演講者說服他的聽眾去接受,也需要有清晰的PPT把整個思想展示給閱讀者。畢竟,在這個時代,酒香也怕巷子深。

    為什麼我會這麼建議大家呢?因為每件事情都是有成本的,而一旦有成本就意味著我們需要有收益。我們每一個人都不是萬能的,我們有自己的長處,也有自己的短板。我們在學習時,應該結合自身的特點和情況,最快的從我們的付出中見到成效。

    其實,對於並不在資料分析領域的同學來說,也許絕大多數人都沒有辦法成為一名資料科學家,但卻更有可能成為自己領域的大牛:一名優秀的運營專家、產品經理、HR、財務、銷售、諮詢顧問。讓資料分析成為你在自己職業發展中的一項助力,讓它更好的幫助到你本身的職業發展,也許才是學習資料分析的正確思路和定位。最後,認清自己的優勢和劣勢,明確自己職業發展的方向,選擇最適合自己的道路,做一個最好的自己,這才是每一個人最正確的選擇。

    各位,如果覺得自己並不是對資料很有興趣,只是覺得多一個就業方向,那我建議大家學英語會更實際一點。

  • 中秋節和大豐收的關聯?
  • 探討鯽魚該用什麼鉤以及型號?