分析資料有兩種,
1列表法
將實驗資料按一定規律用列表方式表達出來是記錄和處理實驗資料最常用的方法。表格的設計要求對應關係清楚、簡單明瞭、有利於發現相關量之間的物理關係;此外還要求在標題欄中註明物理量名稱、符號、數量級和單位等;根據需要還可以列出除原始資料以外的計算欄目和統計欄目等。最後還要求寫明表格名稱、主要測量儀器的型號、量程和準確度等級、有關環境條件引數如溫度、溼度等。
2作圖法
作圖法可以最醒目地表達物理量間的變化關係。從圖線上還可以簡便求出實驗需要的某些結果(如直線的斜率和截距值等),讀出沒有進行觀測的對應點(內插法),或在一定條件下從圖線的延伸部分讀到測量範圍以外的對應點(外推法)。此外,還可以把某些複雜的函式關係,透過一定的變換用直線圖表示出來。例如半導體熱敏電阻的電阻與溫度關係為,取對數後得到,若用半對數座標紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
這個要看你分析什麼資料。
分析大資料,R語言和Linux系統比較有幫助,運用到的方法原理可以翻翻大學的統計學,不需要完全理解,重在應用。
分析簡單資料,Excel就可以了。Excel本意就是智慧,功能很強,容易上手。我沒有見過有人說自己精通Excel的,最多是熟悉Excel。Excel的函式可以幫助你處理大部分資料。
一、掌握基礎、更新知識。
基本技術怎麼強調都不過分。這裡的術更多是(計算機、統計知識),多年做資料分析、資料探勘的經歷來看、以及業界朋友的交流來看,這點大家深有感觸的。
資料庫查詢—sql
資料分析師在計算機的層面的技能要求較低,主要是會sql,因為這裡解決一個數據提取的問題。有機會可以去逛逛一些專業的資料論壇,學習一些sql技巧、新的函式,對你工作效率的提高是很有幫助的。
統計知識與資料探勘
你要掌握基礎的、成熟的資料建模方法、資料探勘方法。例如:多元統計:迴歸分析、因子分析、離散等,資料探勘中的:決策樹、聚類、關聯規則、神經網路等。但是還是應該關注一些部落格、論壇中大家對於最新方法的介紹,或者是對老方法的新運用,不斷更新自己知識,才能跟上時代,也許你工作中根本不會用到,但是未來呢?
行業知識
如果資料不結合具體的行業、業務知識,資料就是一堆數字,不代表任何東西。是冷冰冰,是不會產生任何價值的,資料驅動營銷、提高科學決策一切都是空的。
一名資料分析師,一定要對所在行業知識、業務知識有深入的瞭解。例如:看到某個資料,你首先必須要知道,這個資料的統計口徑是什麼?是如何取出來的?這個資料在這個行業,在相應的業務是在哪個環節是產生的?數值的代表業務發生了什麼(背景是什麼)?對於a部門來說,本月新會員有10萬,10萬好還是不好呢?先問問上面的這個問題:
對於a部門,
1、新會員的統計口徑是什麼。第一次在使用a部門的產品的會員?還是在站在公司角度上說,第一次在公司發展業務接觸的會員?
2、是如何統計出來的。a:時間;是透過建立時間,還是業務完成時間。b:業務場景。是隻要與業務發接觸,例如下了單,還是要業務完成後,到成功支付。
3、這個資料是在哪個環節統計出來。在註冊環節,在下單環節,在成功支付環節。
4、這個資料代表著什麼。10萬高嗎?與歷史相同比較?是否做了營銷活動?這個行業處理行業生命同期哪個階段?
在前面二點,更多要求你能按業務邏輯,來進行資料的提取(更多是寫sql程式碼從資料庫取出資料)。後面二點,更重要是對業務瞭解,更行業知識瞭解,你才能進行相應的資料解讀,才能讓資料產生真正的價值,不是嗎?
對於新進入資料行業或者剛進入資料行業的朋友來說:
行業知識都重要,也許你看到很多的資料行業的同仁,在微博或者寫文章說,資料分析思想、行業知識、業務知識很重要。我非常同意。因為作為資料分析師,在發表任何觀點的時候,都不要忘記你居於的背景是什麼?
但大家一定不要忘記了一些基本的技術,不要把基礎去忘記了,如果一名資料分析師不會寫sql,那麻煩就大了。哈哈。。你只有把資料先取對了,才能正確的分析,否則一切都是錯誤了,甚至會導致致命的結論。新同學,還是好好花時間把基礎技能學好。因為基礎技能你可以在短期內快速提高,但是在行業、業務知識的是一點一滴的積累起來的,有時候是急不來的,這更需要花時間慢慢去沉澱下來。
不要過於追求很高階、高深的統計方法,我提倡有空還是要多去學習基本的統計學知識,從而提高工作效率,達到事半功倍。以我經驗來說,我負責任告訴新進的同學,永遠不要忘記基本知識、基本技能的學習。
二、要有三心。
1、細心。
2、耐心。
3、靜心。
資料分析師其實是一個細活,特別是在前文提到的例子中的前面二點。而且在資料分析過程中,是一個不斷迴圈迭代的過程,所以一定在耐心,不怕麻煩,能靜下心來不斷去修改自己的分析思路。
三、形成自己結構化的思維。
資料分析師一定要嚴謹。而嚴謹一定要很強的結構化思維,如何提高結構化思維,也許只需要工作隊中不斷的實踐。但是我推薦你用mindmanagement,首先把你的整個思路整理出來,然後根據分析不斷深入、得到的資訊不斷增加的情況下去完善你的結構,慢慢你會形成一套自己的思想。當然有空的時候去看看《麥肯錫思維》、結構化邏輯思維訓練的書也不錯。在我以為多看看你身邊更資深同事的報告,多問問他們是怎麼去考慮這個問題的,別人的思想是怎麼樣的?他是怎麼構建整個分析體系的。
四、業務、行業、商業知識。
當你掌握好前面的基本知識和一些技巧性東西的時候,你應該在業務、行業、商業知識的學習與積累上了。
這個放在最後,不是不重要,而且非常重要,如果前面三點是決定你能否進入這個行業,那麼這則是你進入這個行業後,能否成功的最根本的因素。資料與具體行業知識的關係,比作池塘中魚與水的關係一點都不過分,資料(魚)離開了行業、業務背景(水)是死的,是不可能是“活”。而沒有“魚”的水,更像是“死”水,你去根本不知道看什麼(方向在哪)。
如何提高業務知識,特別是沒有相關背景的同學。很簡單,我總結了幾點:
1、多向業務部門的同事請教,多溝通。多向他們請教,資料分析師與業務部門沒有利益衝突,而更向是共生體,所以如果你態度好,相信業務部門的同事也很願意把他們知道的告訴你。
2、永遠不要忘記了google大神,定製一些行業的關鍵字,每天都先看看定製的郵件。
3、每天有空去瀏覽行業相關的網站。看看行業都發生了什麼,主要競爭對手或者相關行業都發展什麼大事,把這些大事與你公司的業務,資料結合起來。
4、有機會走向一線,多向一線的客戶溝通,這才是最根本的。
標題寫著告誡,其實談不上,更多我自己的一些心得的總結。希望對新進的朋友有幫助,資料分析行業絕對是一個朝陽行業,特別是網際網路的不斷髮展,一個不談資料的公司根本不叫網際網路公司,資料分析師已經成為一個網際網路公司必備的職位了。
分析資料有兩種,
1列表法
將實驗資料按一定規律用列表方式表達出來是記錄和處理實驗資料最常用的方法。表格的設計要求對應關係清楚、簡單明瞭、有利於發現相關量之間的物理關係;此外還要求在標題欄中註明物理量名稱、符號、數量級和單位等;根據需要還可以列出除原始資料以外的計算欄目和統計欄目等。最後還要求寫明表格名稱、主要測量儀器的型號、量程和準確度等級、有關環境條件引數如溫度、溼度等。
2作圖法
作圖法可以最醒目地表達物理量間的變化關係。從圖線上還可以簡便求出實驗需要的某些結果(如直線的斜率和截距值等),讀出沒有進行觀測的對應點(內插法),或在一定條件下從圖線的延伸部分讀到測量範圍以外的對應點(外推法)。此外,還可以把某些複雜的函式關係,透過一定的變換用直線圖表示出來。例如半導體熱敏電阻的電阻與溫度關係為,取對數後得到,若用半對數座標紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
這個要看你分析什麼資料。
分析大資料,R語言和Linux系統比較有幫助,運用到的方法原理可以翻翻大學的統計學,不需要完全理解,重在應用。
分析簡單資料,Excel就可以了。Excel本意就是智慧,功能很強,容易上手。我沒有見過有人說自己精通Excel的,最多是熟悉Excel。Excel的函式可以幫助你處理大部分資料。
一、掌握基礎、更新知識。
基本技術怎麼強調都不過分。這裡的術更多是(計算機、統計知識),多年做資料分析、資料探勘的經歷來看、以及業界朋友的交流來看,這點大家深有感觸的。
資料庫查詢—sql
資料分析師在計算機的層面的技能要求較低,主要是會sql,因為這裡解決一個數據提取的問題。有機會可以去逛逛一些專業的資料論壇,學習一些sql技巧、新的函式,對你工作效率的提高是很有幫助的。
統計知識與資料探勘
你要掌握基礎的、成熟的資料建模方法、資料探勘方法。例如:多元統計:迴歸分析、因子分析、離散等,資料探勘中的:決策樹、聚類、關聯規則、神經網路等。但是還是應該關注一些部落格、論壇中大家對於最新方法的介紹,或者是對老方法的新運用,不斷更新自己知識,才能跟上時代,也許你工作中根本不會用到,但是未來呢?
行業知識
如果資料不結合具體的行業、業務知識,資料就是一堆數字,不代表任何東西。是冷冰冰,是不會產生任何價值的,資料驅動營銷、提高科學決策一切都是空的。
一名資料分析師,一定要對所在行業知識、業務知識有深入的瞭解。例如:看到某個資料,你首先必須要知道,這個資料的統計口徑是什麼?是如何取出來的?這個資料在這個行業,在相應的業務是在哪個環節是產生的?數值的代表業務發生了什麼(背景是什麼)?對於a部門來說,本月新會員有10萬,10萬好還是不好呢?先問問上面的這個問題:
對於a部門,
1、新會員的統計口徑是什麼。第一次在使用a部門的產品的會員?還是在站在公司角度上說,第一次在公司發展業務接觸的會員?
2、是如何統計出來的。a:時間;是透過建立時間,還是業務完成時間。b:業務場景。是隻要與業務發接觸,例如下了單,還是要業務完成後,到成功支付。
3、這個資料是在哪個環節統計出來。在註冊環節,在下單環節,在成功支付環節。
4、這個資料代表著什麼。10萬高嗎?與歷史相同比較?是否做了營銷活動?這個行業處理行業生命同期哪個階段?
在前面二點,更多要求你能按業務邏輯,來進行資料的提取(更多是寫sql程式碼從資料庫取出資料)。後面二點,更重要是對業務瞭解,更行業知識瞭解,你才能進行相應的資料解讀,才能讓資料產生真正的價值,不是嗎?
對於新進入資料行業或者剛進入資料行業的朋友來說:
行業知識都重要,也許你看到很多的資料行業的同仁,在微博或者寫文章說,資料分析思想、行業知識、業務知識很重要。我非常同意。因為作為資料分析師,在發表任何觀點的時候,都不要忘記你居於的背景是什麼?
但大家一定不要忘記了一些基本的技術,不要把基礎去忘記了,如果一名資料分析師不會寫sql,那麻煩就大了。哈哈。。你只有把資料先取對了,才能正確的分析,否則一切都是錯誤了,甚至會導致致命的結論。新同學,還是好好花時間把基礎技能學好。因為基礎技能你可以在短期內快速提高,但是在行業、業務知識的是一點一滴的積累起來的,有時候是急不來的,這更需要花時間慢慢去沉澱下來。
不要過於追求很高階、高深的統計方法,我提倡有空還是要多去學習基本的統計學知識,從而提高工作效率,達到事半功倍。以我經驗來說,我負責任告訴新進的同學,永遠不要忘記基本知識、基本技能的學習。
二、要有三心。
1、細心。
2、耐心。
3、靜心。
資料分析師其實是一個細活,特別是在前文提到的例子中的前面二點。而且在資料分析過程中,是一個不斷迴圈迭代的過程,所以一定在耐心,不怕麻煩,能靜下心來不斷去修改自己的分析思路。
三、形成自己結構化的思維。
資料分析師一定要嚴謹。而嚴謹一定要很強的結構化思維,如何提高結構化思維,也許只需要工作隊中不斷的實踐。但是我推薦你用mindmanagement,首先把你的整個思路整理出來,然後根據分析不斷深入、得到的資訊不斷增加的情況下去完善你的結構,慢慢你會形成一套自己的思想。當然有空的時候去看看《麥肯錫思維》、結構化邏輯思維訓練的書也不錯。在我以為多看看你身邊更資深同事的報告,多問問他們是怎麼去考慮這個問題的,別人的思想是怎麼樣的?他是怎麼構建整個分析體系的。
四、業務、行業、商業知識。
當你掌握好前面的基本知識和一些技巧性東西的時候,你應該在業務、行業、商業知識的學習與積累上了。
這個放在最後,不是不重要,而且非常重要,如果前面三點是決定你能否進入這個行業,那麼這則是你進入這個行業後,能否成功的最根本的因素。資料與具體行業知識的關係,比作池塘中魚與水的關係一點都不過分,資料(魚)離開了行業、業務背景(水)是死的,是不可能是“活”。而沒有“魚”的水,更像是“死”水,你去根本不知道看什麼(方向在哪)。
如何提高業務知識,特別是沒有相關背景的同學。很簡單,我總結了幾點:
1、多向業務部門的同事請教,多溝通。多向他們請教,資料分析師與業務部門沒有利益衝突,而更向是共生體,所以如果你態度好,相信業務部門的同事也很願意把他們知道的告訴你。
2、永遠不要忘記了google大神,定製一些行業的關鍵字,每天都先看看定製的郵件。
3、每天有空去瀏覽行業相關的網站。看看行業都發生了什麼,主要競爭對手或者相關行業都發展什麼大事,把這些大事與你公司的業務,資料結合起來。
4、有機會走向一線,多向一線的客戶溝通,這才是最根本的。
標題寫著告誡,其實談不上,更多我自己的一些心得的總結。希望對新進的朋友有幫助,資料分析行業絕對是一個朝陽行業,特別是網際網路的不斷髮展,一個不談資料的公司根本不叫網際網路公司,資料分析師已經成為一個網際網路公司必備的職位了。