-
1 # 帆軟軟體
-
2 # 資料觀商業管理雲
課程:
必學且免費的基礎課:統計學 | Udacity(http://cn.udacity.com/course/statistics--st095)
書籍:必看的入門書:《精益資料分析》[美]埃裡克-萊斯 叢書主編
工具:把紙上知識實際操練起來的工具:資料觀|新一代商業分析平臺(www.shujuguan.cn/?from=18041101)
推薦這個工具主要是因為它操作起來特別簡單,不需要程式設計,很適合新手在演練中梳理、內化資料分析的知識與思路。相信如果工具不好用的話,你花在“kao這一步怎麼實現的”上的時間會遠遠大於“這個指標更適合解決我現在的問題”上。
畢竟資料分析師拼的不是程式設計技術高低,而是用資料解決問題的能力。
下面再分享一個我們內部培訓的資料分析基礎ppt,非常適合入門級選手。如果喜歡就表示一下哦~
-
3 # 綠茸茸121
資料分析分為兩部分,資料和分析。
而分析才是大學問。對於資料的引用,分析的方法,推薦你可以參考一些部門、協會和機構的高質量資料報告,比如麥肯錫,尼爾森,思略特,艾媒諮詢,多參考專業的報告進行練習。
-
4 # 非人類SsS
沒有計算機基礎,沒有程式設計基礎,不知道有沒有數學基礎,線代基礎,統計方面的知識,要是有的話,學起來相對能輕鬆點。
是為了求職而學的話,資料分析職位對於應聘者的要求都有:資料庫會SQL,MYSQL或者其他,會R,Python,java其中一種或兩種程式設計,統計軟體的話,會SPSS,R,State等,當然,excel功能很強大,能熟練使用各種函式或者資料分析也是必須的。
學習建議的話,可以從excel入手,深度學習方法和技巧,接著學習線代,數學,統計的理論知識,會的話略過,然後開始著手軟體,結合各種案例多分析多聯絡多思考,在學習計算機原理的同時,可以結合著學學程式設計,學程式設計的過程中會涉及到從資料庫挖掘資料什麼的,可以看看資料庫的書,最後,可以爬蟲,挖掘需要的資料,並自己做有效分析,得出有價值的結論。
總之,從興趣出發,堅持學習就夠了。
-
5 # 公子義
新媒體資料分析
但運營童鞋多是資料小白,沒有程式設計和技術基礎,該怎麼分析並用好資料呢?
今天從運營常見的資料問題出發,希望讓大家能快速地入門資料分析,讓資料更好地為工作服務,別白白浪費資料的價值。
一、資料分析應該從哪裡入手?
從哪些角度入手?這是運營小夥伴們最頭痛的問題,不知道該關注、分析哪些資料,就算拿到資料後,也不知道到底從哪些方面去分析這些運營資料。
新媒體資料分析
1、新媒體運營關注的常見資料指標
1)訪問:PV、UV、IP(最常見);跳出率、平均訪問時長、平均訪問頁數等;
2)註冊:關注人數、關注走勢、累計關注人數、轉化率等;
使用者
使用者喜好文章的型別
3)頭像:分析使用者屬性,關注年齡、性別、學歷、職業、地域、婚否、收入、興趣等;
2、新媒體運營資料分析要遵循哪些原則?
但是運營畢竟不是專業的資料分析師,主要能用好這些原則就夠了~
對比:分成橫向和縱向對比,比如縱向的同環比分析,橫向的不同產品、不同渠道的對比等;
走勢(變化):指標隨時間的變動,表現為增幅(同比、環比等);
分佈:這個好理解,比如說使用者不同年齡段的分類、不同職業的分佈、不同地域分佈等;
使用者地域分佈圖
細分:從多層級去了解資料,比如分析全國不同省份不同城市的具體訂單資料,從全國—省份—城市一一下鑽深入分析;
如何變身自己的“專屬分析師”呢~資料分析的整個過程:確定指標——資料收集——資料整合、資料處理/建模、資料分析、資料呈現、報表整理
爆款文章資料分析
資料分析:可參考分析方法,比如“求和、計數、同環比、多粒度下鑽”等分析,一般在Excel中需透過寫公式搞定。
資料呈現(視覺化):
簡單地說,就是如何製圖唄,報表彙報:將資料透過表格、圖表或其他形式向領導彙報。如何不依賴分析師,自己搞定資料分析呢?
1、學習一些資料分析理論。(資料思維)
2、瞭解、熟悉業務,這點很重要。(業務思路)
3、學習一些資料分析工具。(工具輔助)以我的個人經驗來看,真正把握這些真真是夠了
二、如何製作讓老闆滿意的好看圖表?
沒有哪個老闆喜歡雜亂的表格資料,顏值才是王道啊。簡單地說,就是資料如何視覺化,讓資料直觀、明瞭。
分析資料佔比:分析單維度的資料佔比可用餅/環圖、分析多維度的資料佔比,可用旭日圖和矩形樹圖。
分析資料走線圖:最常用的是折線圖,柱狀圖也可以表達,直觀度略低於折線圖。分析地區分佈:全國、省份分佈可用行政地圖,更詳細的地域分佈可用經緯。
使用者分析詞頻
分析詞頻:比如使用者的職位分佈,可用詞雲,有3D效果哦~分析轉化效果:那肯定用漏斗圖最最合適。
關於轉化,分享一個自己身邊的真實故事。每個圖表都有適合的使用場景,用好各種圖表很重要,直接影響到資料的直觀和美觀程度。
三、如何快速找到資料背後的問題?
做了那麼多的資料工作,最終無非是為了從資料中去發現問題,不斷最佳化運營策略。
不論資料是上升了還是下降了,肯定有其變化的原因,這裡以使用者資料變化為例瞭解一下快速找到問題的思路。
看資料—發現問題—解決問題—再看資料—問題解決,或者看資料—發現增長—找到原因—繼續應用。
-
6 # 加米穀大資料
怎麼入門資料分析?
1、打好機率與統計的基礎
機率與統計是資料分析的基石,像一些機率分佈、抽樣、線性迴歸、時間序列都是資料分析當中經常會用到的,可以說日常碰到的大部分的分析需求都可以用統計分析來解決。
2、掌握資料庫技能
做資料分析離不開查詢資料庫,這裡主要涉及的是SQL。對於傳統的資料庫如MySQL,SQL Server,Oracle,或者大資料平臺Hadoop,都可以透過SQL查詢的方式來獲取資料。
3、掌握Python或者R
Python和R是資料分析當中最常用的兩門語言。R是為資料分析而生的一門語言,但Python在資料分析方面有後來居上的趨勢。
4、機器學習
資料分析如果繼續深入的話,可以學習機器學習。機器學習涉及的理論主要是分類、迴歸、聚類、決策樹、貝葉斯定理等。
相關:大資料分析學習的詳細解讀
https://www.toutiao.com/i6616593013986558471/
資料科學,資料分析和機器學習之間的差異
https://www.toutiao.com/i6592350285857817102/
https://www.toutiao.com/i6630975917390823943/
-
7 # 吾理數
作為一個文科生,圖書館學專業。
大學第一次接觸計算機(不知道怎麼開機,丟人嘍)。
四年優秀的大學生涯,第一次掛科是:計算機,最後一次掛科也是:計算機。
缺乏理科素養,計算機小白痴,又是計算專業的門外漢。
畢業找到了網際網路研發工作(大學自學程式設計:Java,前端)
工作是資料開發,寫SQL
現在,我在努力的學習統計學,多元分析,資料探勘。這麼努力只是因為我太窮!
我理解的資料:我們在由人,物,事 組成的時空場景,透過事來完成人與物的互動,這也是生命無終無始過程。人或物獨立存在時中我們只能用“0”去重新的描述。當人和物透過事互動的時,我們可以對人和我作出更多的瞭解,比如我們用尺子來度量人:不瞭解到人有高低胖瘦,尺有長短精密。資料是客觀描述與抽象認知。互動繁生資料,資料又作用於互動。
在統計,分析,挖掘中定位什麼是資料分析:
統計的側重點:瞭解(描述)事物,數字化也更好的傳達這種數字化了解。
分析的側重點:發現問題,發現細微的差異變化。
挖掘的側重點:發現價值,升級認知,獲取更多價值。
所以開始學資料分析第一步是:學習基礎的統計學,只有瞭解了事物才能開始分析。
統計,分析,挖掘 都是處理資料的方式方法,是彼此銜接的一個過程,有聯絡有交集。沒有明顯的界限,卻又獨特的特點。
統計: 需要了解基礎的統計量:最大值,最小值,中位數,中序數,眾數... 最重要的是均值和方差;資料的分佈:卡方分佈,二項式分佈,正態分佈;假設檢驗的方法;---是什麼?
分析: 相關性分析方法比如:分類,聚類,判別,典型相關性。關聯分析考察多因素對事物的影響:方差分析,因子分析,主成分分析,迴歸分析;--怎麼了?
挖掘:挖掘透過統計和分析發現不了的潛在有價值的規則,比如:關聯推薦(啤酒與尿布),K近鄰,神經網路;用高速計算的電腦來彌補人腦的短板。--這樣呀?
從統計學基礎開始,沒到週六日我都抱著《商務統計學》看呀看呀,看了很久,慢慢的開始頓悟了,也許這就是時間的力量,不斷堅持的力量吧,相信:無他,唯手熟爾。
然後,就買了一本 統計學基礎R版,開始學著用R語言去實踐分析,也是堅持學了R的各種常用的資料分析方法,大資料面前,excel的處理能力比較有所侷限,學一門計算機語言,藉助計算機的處理能力,我們的資料分析能力能夠更進一步,更上一層樓。
現在,每週堅持用R去做一些有趣的資料分析,累計寫了很多很多分析相關的文章,實踐演練是學習真功夫的最佳途徑;有圖為證。
發現數據分析也是一件有門有道,有章有法的事。簡單而言六個字:“構成,對比,趨勢”
構成——是資料內部的組合分佈,主要描述“我”是誰?知道“我”是誰是最為關鍵的一步,正如一句古語:“知己知彼,百戰不殆”。
對比——是組成部分的對比知道我最重要的是什麼;現在“我”與過去“我”的對比知道成長;同類的對比知道“我”與“他”的不同,顯示我的優劣不足,我們才能有的放矢。
趨勢——是變化走向的描述,主要掌握“我”要到哪裡去,有跡可循,有蹤可跟,我們才能把握未知,不偏不倚的駛向好的未來。
沒有計算機基礎,沒有程式設計基礎的人,該怎麼學習資料分析,第一步要做到什麼,然後應該做什麼?怎麼一步一步自學?先打哪些基礎?如果有學習平臺推薦就更好了,先謝過各位
回覆列表
一、為什麼學習資料分析
1、運營的尷尬:運營人需要一個硬技能
每個初入行的新人都會察覺到,運營是一個似乎並沒有自己的核心競爭力和安全感的工作。因為每天的工作好像都被各種瑣事所圍繞,而只有一個主題是永恆不變的,那就是---提需求,不斷的提各種需求。
運營人需要一個硬核技能,提升自己的職業價值,提高自己的職業安全感,而不是每天都在各種的等排期:資料分析排期、產品設計排期、UI排期、開發排期。
運營迫切需要透過利用SQL/Python等工具,從資料中及時發現更多的業務價值,提高自己的產出。
2、資料分析的前景這幾年隨著人工智慧的火熱,資料分析技能也逐漸受到了更多的認可。從國外BA專業申請和國內資料分析培訓的火熱也可見一斑。但對於在職人士,從單純的技能習得角度去看,BA的能力完全是可以自學獲得的。
我認為,未來資料分析能力在運營人的能力模型中的比重仍會繼續加大,將來甚至會擠壓資料分析師的需求和生存空間,所以,對於資料分析,前景很好,而資料分析師,前景並不樂觀。
二、學習資料分析需要做的準備1、明確方向:資料分析有兩個方向:
一個是業務向:如資料產品經理、資料分析師,對技術要求並不那麼高;
一個是技術向:需要懂資料探勘、演算法等,對技術的要求較高。
從自己的定位來看,並不打算做資料探勘,因為自己的知識結構和時間上的投入產出比可能並不太高。主要希望透過資料分析技能,增強自己作為產品運營的競爭力。
2、做好持久戰準備:於我一個沒有任何基礎的純小白而言,並不是能速成的,需要做好持續學習的準備。
三、做好資料分析需要具備哪些技能1、統計學基礎知識
2、Excel的熟練使用
3、SQL
4、Python
5、分析方法和思維
6、對業務的充分理解
從自身來看,主要需要彌補的為:SQL+EXCEL+統計+PYTHON。
主要以看書為主,影片為輔,不需要報任何的培訓班。
1、SQLSQL大概是網際網路公司做資料分析用到的最多、最重要的工具了,在整個資料分析過程中,用Sql提取資料,可能要佔到整個資料分析過程的50%-80%,以至於很多資料分析師都被戲稱為“Sql Boy/Girl”。
mysql資料庫的功能可以用四個字概括:增刪改查。
但是對於我們來說,我們能用到的只會有資料庫查詢功能,其它許可權是不可能開放給你的。
如果資料庫你覺得生澀的話,可以這麼理解:
•SQL? 就是一條存取資料的命令
•資料庫? 就相當於一個資料夾
•資料表? 就相當於資料夾內的一個Excel檔案
–表名就是檔名
–表中的每一列有一個名字,就是列名,也可以成為欄位
SQL的學習可以分為三塊:
簡單查詢、
關聯查詢、
函式引用。
什麼是查詢呢?
在資料庫建立之後,透過sql命令裡最常用的語句SELECT,讓我們檢視資料庫裡儲存的資料,並可以進行一定的分析和歸納。
簡單查詢:
SELECT語句的完整格式包含6個子句:
2、WHERE 子句:查詢資料的過濾條件。
3、GROUP BY 子句:對匹配 WHERE 子句的查詢結果進行分組。
4、HAVING 子句:對分組後的結果進行條件限制。
5、ORDER BY 子句:對查詢結果進行排序,後面跟 DESC 降序或 ASC 升序(預設)。
6、LIMIT 子句:對查詢的顯示結果限制行數。
關聯查詢:
如果要進行多表查詢,就需要用到連線。
連線查詢是把兩個或多個表連線在一起來獲取資料,是關係型資料庫中最主要的查詢。表的連線方式主要包括內連線、外連線和交叉連線等。
1、from 指定查詢表名、並給出別名。
2、left join 左外連線,左表全部記錄及右表匹配記錄出現在查詢結果中。
3、inner join 內連線,左表和右表共同的記錄出現在查詢結果中。
4、right join 右外連線,右表全部記錄及左表匹配記錄出現在查詢結果中。
5、on 指定關聯條件。
表連線後的結果可以透過這個圖清晰的展示出來。
舉個栗子:
函式引用:
利用函式可以提高sql的效率,經常用到的函式主要有:
邏輯運算:and、or、not;
數值運算:round、floor、ceil、rand、exp、sqrt等;
日期函式:from_unixtime、unix_timestamp、year、month、day、hour、minute、second、weekofyear、detediff、date_add、date_sub等;
條件函式:if、coalesce、case when等;
字串函式:concat、substr、trim、reverse、split等;
集合統計函式:count、sum、max、min、percentile等。
推薦書目:
推薦下我們部門每個運營同學人手一本的必備書目:
《SQL必知必會》
Hive
隨著資料量的不斷增加,很多時候mysql已經滿足不了資料需要,很多公司開始使用hive或者presto。
其實有了SQL的基礎,HIVE學習還是比較簡單的。
推薦書目:《HIVE程式設計指南》
重點看下HQL的資料操作、查詢、調優部分,與mySQL大同小異,只是一些語法需要單獨注意下即可。
2、ExcelExcel大家多少都會一些,它的功能很強大,但是絕大多數人,可能使用了它的1%功能都不到。
Excel 可以進行各種資料的處理、統計分析和輔助決策等,作為常用的資料處理和展現工 具,我們除了要熟練使用Excel 的函式和資料透視表等操作工具,更重要的是,利用好Excel 的視覺化,用圖表將結論展現出來,這樣分析和視覺化能力會得到迅速提高。
SQL+Excel可以說是資料分析的必備神器。
推薦書目:《誰說菜鳥不會資料分析》。
這本書不只是介紹Excel的功能,更重要的是介紹一些實踐場景中資料分析的步驟和思路,對於初學者有很大的指導意義。
3、統計學統計學是資料分析的理論基礎,可以使資料分析更加系統化。沒有統計學基礎的資料分析師的職業發展之路不會長遠,因為在工作中可能會常常遇到不知道該用什麼方法找尋資料規律的瓶頸,因此掌握資料分析的統計學基礎知識是成為一名優秀資料分析師的基礎。
主要需要掌握:
用於集中趨勢分析的平均數、中數、眾數;
用於離中趨勢分析的全距、 四分差、平均差、方差、標準差;
研究現象之間是否存在某種依存關係的相關分析;
確定兩種或 兩種以上變數間相互依賴的定量關係的迴歸分析;
揭示同一個變數的各個類別之間的差異,以及不同變數各個類別之間的對應關係的關聯分析、R-Q 型因子分析;
研究從變數群中提取共性因子 的因子分析;
用於兩個及以上樣本均數差別的顯著性檢驗的方差分析;
機率及分佈、引數估計、 假設檢驗等等經典統計學內容。
很多人都推薦《商務與經濟統計》,說實話,這本書對小白並不友好。
我的進階路徑是:《赤裸裸的統計學》→《深入淺出統計學》→《商務與經濟統計》
前面2本書更加有趣味性,對於小白,更容易理解,不至於讓你很快從學習到放棄。
4、Python說實話,網際網路行業日常的資料分析中用到python的機會並不多,SQL+EXCEL可以說能解決95%的工作需要。另外5%主要是在資料量較大,SQL已經無法滿足工作需要時,那麼Python大法就該出場了。
我們分析一般都是有了現成的公司資料,很少有從外部獲取的,所以爬蟲,可以暫時先不學,有需要的話,先找爬蟲外掛搞定即可。
主要學習python基礎和資料分析的幾個包。
作為一個沒有程式設計、數學、統計基礎的小白,我是從《父與子的程式設計之旅》開始看的,這本書對我這種完全負基礎的人,真是極度友好,可以說,看了很多推薦的書和影片,最開始學習的時候,只有這一本書是我可以看懂,而且看得下去的。
這本書看完後,又對照《笨方法學python》做了些題目,然後可以進入python資料分析的學習,主要是《利用python進行資料分析》,主要掌握numpy、pandas、Matplotlib庫等。