-
1 # VR天下
-
2 # 西線學院
資料分析熱火朝天的今天,很多人表示希望透過自學瞭解資料分析的基本知識。想要學會資料分析並不是一件非常簡單的事,需要了解多學科知識,還要熟練使用資料分析工具。例如能使用Excel、Hadoop、大資料魔鏡等篩選資料、提取寫資訊等。那麼想要學資料分析,在理論知識上又需要哪些知識?這裡推薦幾本書供讀者參考。
NO.1《誰說菜鳥不會資料分析》
資料書目中的基礎書籍,按照資料分析工作的完整流程進行基礎講解。書中講解了資料分析必知必會的知識、資料處理技巧、資料展現的技術、透過專業化的視角來提升圖表之美、資料分析報告的撰寫技能以及持續的修煉。這本書形式較為活潑,讀起來引人入勝。非常適合讀者作為資料分析的入門書籍。
NO.2《資料分析——企業的賢內助》
可以作為另一個小黃書升級閱讀的備選也不錯。以企業經營中的案例為依託,將複雜的資料分析知識巧妙地融入其中,完整呈現資料分析專案的流程,系統闡述資料分析的專業思路、方法和技能。同樣是故事和對話來引人進入場景的方式,但是要比小黃書講的再細緻一些。尤其是第二章,對於職業發展比較困惑又想從事資料分析專業的人員來說,應該有一些幫助。
NO.3《資料視覺化之美》
這本書中,20多名視覺化專家,有藝術家、設計師、評論家、科學家、分析師、統計學家等,展示了他們如何在各自的學科領域內開展專案,展示了視覺化所能給我們帶來的改變。讓讀者瞭解視覺化工具的作用。我們能從中瞭解到各個領域的視覺化為我們帶來的方法和資訊內容。
NO.4《EXCEL資料處理與分析實戰技巧精粹》
這本書中,有詳盡的例項,精彩的講解,細緻的描述,多角度的剖析,融匯Excel Home萬千問題與答案,彰顯Excel豐富內涵。從社群上百萬提問中提煉出的實用技巧。全面直擊Excel資料處理與分析精髓。涵蓋主題:資料透視表、資料的輸入和匯入、資料整理和編輯、資料查詢、常規計算分析、高階分析。Excel home是著名的華語Office技術社群、資源站點,微軟技術社群聯盟成員。
NO.5《深入淺出資料分析》
類似“章回小說”的活潑形式,生動地向讀者展現優秀的資料分析人員應知應會的技術:資料分析基本步驟、實驗方法、最最佳化方法、假設檢驗方法、貝葉斯統計方法、主觀機率法、啟發法、直方圖法、迴歸法、誤差處理、相關資料庫、資料整理技巧;正文以後,意猶未盡地以三篇附錄介紹資料分析十大要務、R工具及toolpak工具,在充分展現目標知識以外,為讀者搭建了走向深入研究的橋樑。
-
3 # 啵啵啵啵啵吧啾
看到大家都推薦了不少的資料分析類書單,那我就分享一些工具吧!
以下排名順序與優劣無關哦~
1、資料觀(資料來源多,資料處理和互動分析很強大)
2、圖表秀--免費線上圖表製作工具,資料視覺化工具
3、ECharts(需要懂程式碼)
4、圖表網-線上生成統計圖表製作直方圖折線圖餅圖扇形圖統計圖形(效果略 low)
5、百度 · 圖說(基於echarts的產品 功能較為單一 當然也可以稱為專注)
6、首頁 | 文圖(偏infographic,資料還靠線上編輯呢)
7、智圖GeoQ | 位置智慧平臺
-
4 # 千鋒頭號粉絲
在大資料和大資料分析,他們對企業的影響有一個興趣高漲。大資料分析是研究大量的資料的過程中尋找模式,相關性和其他有用的資訊,可以幫助企業更好地適應變化,並做出更明智的決策。整理了一些大資料分析能用到的工具,助力大家更好的應用大資料技術。
一、hadoop
Hadoop 是一個能夠對大量資料進行分散式處理的軟體框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和儲存會失敗,因此它維護多個工作資料副本,確保能夠針對失敗的節點重新分佈處理。Hadoop 是高效的,因為它以並行的方式工作,透過並行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級資料。此外,Hadoop 依賴於社群伺服器,因此它的成本比較低,任何人都可以使用。
Hadoop帶有用 Java 語言編寫的框架,因此執行在 Linux 生產平臺上是非常理想的。Hadoop 上的應用程式也可以使用其他語言編寫,比如 C++。
二、HPCC
HPCC,High Performance Computing and Communications(高效能計算與通訊)的縮寫。1993年,由美國科學、工程、技術聯邦協調理事會向國會提交了“重大挑戰專案:高效能計算與 通訊”的報告,也就是被稱為HPCC計劃的報告,即美國總統科學戰略專案,其目的是透過加強研究與開發解決一批重要的科學與技術挑戰問題。HPCC是美國實施資訊高速公路而上實施的計劃,該計劃的實施將耗資百億美元,其主要目標要達到:開發可擴充套件的計算系統及相關軟體,以支援太位級網路傳輸效能,開發千兆 位元網路技術,擴充套件研究和教育機構及網路連線能力。
三、Storm
Storm是自由的開源軟體,一個分散式的、容錯的實時計算系統。Storm可以非常可靠的處理龐大的資料流,用於處理Hadoop的批次資料。Storm很簡單,支援許多種程式語言,使用起來非常有趣。Storm由Twitter開源而來,其它知名的應用企業包括Groupon、淘寶、支付寶、阿里巴巴、樂元素、 Admaster等等。
Storm有許多應用領域:實時分析、線上機器學習、不停頓的計算、分散式RPC(遠過程呼叫協議,一種透過網路從遠端計算機程式上請求服務)、 ETL(Extraction-Transformation-Loading的縮寫,即資料抽取、轉換和載入)等等。Storm的處理速度驚人:經測 試,每個節點每秒鐘可以處理100萬個資料元組。Storm是可擴充套件、容錯,很容易設定和操作。
四、Apache Drill
為了幫助企業使用者尋找更為有效、加快Hadoop資料查詢的方法,Apache軟體基金會近日發起了一項名為“Drill”的開源專案。Apache Drill 實現了 Google"s Dremel。該專案將會創建出開源版本的谷歌Dremel Hadoop工具(谷歌使用該工具來為Hadoop資料分析工具的網際網路應用提速)。而“Drill”將有助於Hadoop使用者實現更快查詢海量資料集的目的。
透過開發“Drill”Apache開源專案,組織機構將有望建立Drill所屬的API介面和靈活強大的體系架構,從而幫助支援廣泛的資料來源、資料格式和查詢語言。
五、RapidMiner
RapidMiner是世界領先的資料探勘解決方案,在一個非常大的程度上有著先進技術。它資料探勘任務涉及範圍廣泛,包括各種資料藝術,能簡化資料探勘過程的設計和評價。
六、 Pentaho BI
Pentaho BI 平臺不同於傳統的BI 產品,它是一個以流程為中心的,面向解決方案(Solution)的框架。其目的在於將一系列企業級BI產品、開源軟體、API等等元件整合起來,方便商務智慧應用的開發。它的出現,使得一系列的面向商務智慧的獨立產品如Jfree、Quartz等等,能夠整合在一起,構成一項項複雜的、完整的商務智慧解決方案。
Pentaho BI 平臺構建於伺服器,引擎和元件的基礎之上。這些提供了系統的J2EE 伺服器,安全,portal,工作流,規則引擎,圖表,協作,內容管理,資料整合,分析和建模功能。這些元件的大部分是基於標準的,可使用其他產品替換之。
-
5 # 奧威軟體大資料BI
剛開始要練手的話,可以選擇免費的資料分析軟體,像SpeedBI資料分析雲這種就很好用。這款工具是個人免費的,並且是一款智慧資料視覺化分析軟體,可做移動視覺化分析、大屏視覺化等。
-
6 # 天涯海棠G
我是一個普通的電商運營,因此我推薦的書最多隻是適合普通電商運營的日常需求,我推薦的也必是我閱讀過的,我認為對我工作有用的。下面是我推薦的書,也是我閱讀時的筆記:
剛在做《從1開始:資料分析師成長之路》這本書,作者是張旭東。
1.好的作者寫的書籍,總是能夠把一門技能、一種思維由淺入深地娓娓道來,並且這過程有哪些注意的點,在實踐過程中會出現什麼問題,都能夠一一說明,這才是有豐富實踐經驗的作者,這才是真正有無與倫比的作者!
比如作者論述excel圖表時是這樣說的:
拆線圖反映變化趨勢;
餅狀圖反映組成成分;
柱狀圖反映數值大小;
散點圖反映資料集中度;
面積圖反映資料累積情況。
並針對現實場景進行了一一舉例。
這雖然是對圖表簡單的描述,也正是這麼基礎的描述,你能感受到作者是經過多少實踐、也大機率是在不斷教導新人的過程中總結出來的經驗,而絕對不是東拼西湊成書的。
另一個例子是論述資料需求處理時,作者給出的流程是:
需求方(提需求)——分析師(確認需求的目的)——目標資料拆分——提供資料——效果追蹤。
這是簡單的流程,作者分別對每一步進行說明,並且對第一步需要用到的實用技巧也提點出來了,比如目標資料可以如何拆分:可以從屬性、行為這兩個維度,
屬性:地域、年齡、性別、星座......
同一屬性、不同行為描述概括,比如瞭解某一年齡階段的一系列行為;
不同屬性、同一行為的對比分析,比如不同城市的收藏加購資料對比。
還是簡單的論述,但卻是思路清晰,內容實用,讓我馬上對自己日常工作的資料分析有了條理和清晰的思路!
這才是實戰的作者,實踐經驗豐富的作者知道讀者們需要什麼,因為這就是他每天在做的事情。
2.在本書的前面作者也對數字、資料、數學、統計學以及平均值、方差等基本概念做了簡單的說明,對常用邏輯思維也有例舉,算是對小白的普及引導,對於一個日後將成為專業的運營管理人員來說,無疑能夠增加不少認識;當然別的書籍也會有這樣的描述,本書作者好的地方就在於其簡單明瞭地說明,也有些簡單的例子,讓人看了就懂、理解,不會覺得枯燥, 最重要的,不會讓讀書覺得作者在湊字數!說一些大話、空話!在我經歷了那麼多各種東拼西湊、重複囉嗦湊字數的爛書之後,發現能夠這樣簡單明瞭把事情向讀者說得清楚的書(和作者)是多麼難得。
3.作者說到資料分析的邏輯時,並沒有一一列舉常見的一些資料分析邏輯,可能不是作者想要論述的或作者平時常用的經驗,但我習慣性地在筆記本寫下:常見的資料分析邏輯有哪些?然後自己想到什麼就一一先寫下來,並且舉例子,比如我寫下其中一個邏輯是:結論——論據+論述——結論,大概是總分總的模式,然後我舉的例子是最近我覺得抖音直播是會很快過時的一種帶貨方式(這是我的結論或判斷),然後自己寫出幾個論據(理由)。這是我習慣的一種筆記方式,後續複習筆記時我想到什麼,可以繼續補充發揮,以積累這方面的知識。
4.書中有一句話戳中了我的痛點:許多人為了學習一門技能,先後購買了許多書和教程……不斷與人交流學習……經過一番折騰後卻發現收效甚微,到頭來才發現沒有基於應用場景的學習只能停留在皮毛階段……。簡單來說就是學習要理論與實際先結合,但這耳熟能詳的道理卻往往被我們忽略,不少人都在走這樣的彎路,最終落得個草草收場,認為學習真的是太難了,不是一般人能做的事情!我前幾年一直在走這樣的彎路啊!另外即使明白這個道理也養成了習慣,習慣基於應用場景的學習以保重高效,但有些技能的應用場景本身就很少甚至你沒有機會接觸應用場景,那也很難高效學習,比如管理學、領導力、人際關係這些學問。
總的來說這本書帶給我的啟發是不少的,這是我閱讀過的最好的資料分析的書了,帶給我的更多的是認知上的提升。另外之前看過的資料分析相關的書中也不錯的有《誰說菜鳥不會資料分析》《你早該這麼玩excel》,這兩本書就偏向於具體的資料處理技能,更工具性。
回覆列表
入門篇
1.入門技術篇:
對於初入門的你,首先需要掌握資料分析的思路、方法和流程,思路是靈魂。然後根據業務疏通這些知識,做出嚴謹商務的分析報告。
書籍推薦:
a.《誰說菜鳥不會資料分析》
l誰都需要看的經典入門書,涵蓋了一到兩年的資料分析人員的大部分工作,包括excel技巧、視覺化入門、資料分析方法、資料分析方法論、資料處理入門等。
l隔段時間翻一翻,溫故而知新,理解會更深刻。
b.《左手資料,右手圖表》
這本書主要是excel的進階技巧,主要圍繞業務,學習製作動態圖表,對excel技能提升有很大幫助。
書中大篇幅都是案例,會設計視覺化的知識,如何選用圖表,模仿著做一遍會有很大提升。
工具推薦:Excel/WPS
此階段主要熟悉常用工具的技能,不只是簡單的做表做圖,還要會用excel的VLOOKUP函式,IF語句等等
2.入門業務篇:
a.各資料產品論壇&案例(強烈推薦)
個人認為學習和成長最快的方式之一,是去看各個資料軟體的幫助文件和產品論壇,因為這些都是寫給他們的客戶的,所以通俗易懂,又有案例,又有分析思路,從效果來看,實戰經驗要比書籍好一些。
b.知乎
網際網路方面,當初看了知乎專欄《撩撩資料吧》的電商資料分析系列文章,不光涵蓋簡單的業務,還涉及實體線下的業務管理,收益匪淺。
還有很多資料分析大拿的專欄、回答,還有一些工具的案例。比如網際網路行業的神策、growingio,官網的文章寫得很系統,很不錯。
書籍推薦:
a.《資料分析,企業的賢內助》
類似洗腦式的書籍(無貶義),以場景和案例入手,站在企業角度、業務角度來敘述資料分析的重要性,挺有道理的,能讓你更加堅定資料分析這條路。
詳細描述了資料分析的整個流程,從方案確定、資料採集、處理、分析、呈現有全面展示。
b.《精益資料分析》
主要講了不同的公司怎麼樣用資料搭建分析框架,能夠將不同的指標運用到現實,對於道德問題提供解決方案。
工具推薦:資料庫(SQL、My sql等等),報表工具、一些OA、CRM業務系統
資料庫的知識必不可少,Select相關的語句以及where,group by等函式都要會。每個公司的資料庫都不同,可做調整。
資料分析為業務服務,日常工作都會接觸各類系統,這些系統會自帶資料分析呈現功能,不難學,比如常用的報表FineReport,瞭解即可,深入學習也可挖到精髓。
高階篇:當進入高階的時候,這個時候看書已經很之前有了很大的變化:
並不是看單本書,而是學會快速的看書,因為每本書中可能只有幾個模型或者幾個點對你有借鑑,那麼只精讀那幾處,速讀其他部分。
要有自己的理論框架,也就是學會業務建模。
要看業務書,並且能夠把業務書的知識,固化成可以量化、可以監控的資料模型,和流程模型;這個是高級別很重要的一點,因為要能夠快速的切入一個領域,並且能夠用資料找到可以最佳化的辦法。
1、使用者和整體框架
《增長駭客》:創業公司的使用者與收入增長秘籍。
這本書偏網際網路一些,但是順著同樣的思路,去分析每個階段的使用者,並進行運營。
2、資料化運營
《資料化管理》:洞悉零售及電子商務運營。
如果你的資料分析站到了一定高度,尤其是管理,強烈推薦看。能夠把資料化管理推行下去,能夠幫助提升公司整個的管理水平,也是資料部門對公司的貢獻之一。
3、商品管理的書
《品類管理》:教你如何進行商品梳理。
零售業是資料分析應用的大行業,這本書集合了很多傳統零售業的經驗,從裡面學到很多分析模型。
4、大資料
《決戰大資料》:大資料的關鍵思考
作者是淘寶大資料專家-車品覺,他的訪談部落格也建議大家看一下,淘寶大資料不是蓋的。
5、供應鏈
《供應鏈管理》:高成本、高庫存、重資產的解決方案,劉寶紅。
他的書可以多看幾本,每本都是一邊看一邊抹眼淚,滿滿的都是踩過的坑。
6、其他專業書
這個就不多推薦了,關於業務,自然是懂得越多越好。
工具推薦
工具的學習就是見分歧的時候了(本人技術也未有多高超,就自身情況推薦適用的,僅供參考)
1、技術類
統計工具SPSS:統計學類必備
R/Python:這個沒接觸太多,兩者選一就行,看側重點,這一方面可參考《學習計劃 | 7周入門資料分析》。優於工作中業務系統居多,所以這邊也簡單介紹一些第三方工具。
2、業務類
報表類-FineReport水晶潤乾;這一類偏業務,我司資訊部門用FineReport搭建資料中心平臺,管理資料報表,也相應的管一些流程,參與過使用也做過簡單開發。
FineReport
視覺化BI類:tableau、FineBI,BI(商業智慧)類偏自助化的視覺化分析工具,面向業務和領導層。話說專業的分析人員可能不屑,但是在這兩年的行業發展來看已經,在大資料視覺化平臺的構建佔很大席位。
FineBI