回覆列表
  • 1 # 資料分析不是個事兒

    我的觀點:能我從一般的看漲看跌來說起,比如同比增長50%、環比下降60%,複合增長率僅為3%等等,這些都不陌生吧,都是大家常見的典型問題

    這些為什麼是典型的問題呢?增速或者減速的程度超出或者跌出了預期,當預期與實際有差異時,大腦的第一反應,這就是問題,但這真是的問題嗎?這裡給大家思考幾秒,再繼續讀下去

    我拿網上的一個面試題來大家做一個解析:

    某日某APP的DAU下降了20%?

    相信很多人都看過這個題的答案,也有一些博主用這個場景來作為資料分析師的工作場景(假設-驗證)過程,當然要拿那些答案去應付要求不高的JD是沒有問題的,但是要用這個題的答案拿高薪,那我就要給那些答案打個問號了?我解析一下我的思考過程:

    首先是判斷這是不是問題,四大角度:

    1、DAU的定義是什麼?也就是大家常說的這個指標計算的口徑是什麼樣子的?

    2、資料的可信度,這組資料來自哪裡?大家都知道企業的資料庫是很多的,而且之間的關係很複雜,是KPI級別的還是運營級別的,界定是不一樣的

    3、資料的真實性如何?這點很多人忽視了,比如別人拿了一個欠條,說你欠他錢了,你會做什麼?我和核實這個的資訊的準確程度,而不是你說什麼就是什麼

    4、和誰比下降了?比的標準直接會決定你分析的方向

    那回到我們的話題,某日某APP的DAU下降了20%?先要做DAU的定義,這個是DAU的界定是第一步

    DAU是指一個使用者啟動一次APP算一個DAU與APP啟動一次並停留3分鐘以上算一個,分析的複雜程度是不一樣的,直接會影響你後面的分析思維,一個是單一的行為分析,一個是行為+質量的綜合分析,還有幾個指標同時約束的定義,約束條件越多,問題分析的複雜程度越高,思維的要求也會越複雜。

    第三步:資料的真實性,有幾種常見的假設,1、假設資料的傳輸沒有丟包現象:2、假設資料ETL的邏輯沒有錯誤:3、假設最終資料計算的邏輯沒有錯誤;4、假設最近沒有實驗測試:5、假設沒有版本的變更;6、假設統計週期內沒有宕機的情況等等

    第四步,和誰比下降了?以上三步都搞清楚了,接下來就要看和誰比,和去年同期比,那分析的核心可能會是看去年與今年各類維度的多指標分析,和競爭對手比,那分析的核心可能更多是競爭對手的運營策略

    當以上問題都搞清楚時,我們才明白了第一步,這是不是一個問題

    其次判斷問題的嚴重性,2個方向

    當問題出現時,判斷問題的嚴重性,對分析師來講至關重要,這可能會影響你的分析框架和分析的週期、以及要對此付出的時間。

    1、靜態值比對,也就是我們常說的環比、同比,這個只是透過簡單的比對得出的問題,那其實和分子、分母當時的業務環境有很大的關係,那就要找出一個極值來判斷問題的嚴重性,比如本次下降20%,歷史上我們最大值是下降10%或15%,問題的嚴重性是不一樣的,也可以用競爭對手的幅度來作為基準。

    2、動態值比對,很典型的就是複合增長、連續幾天下降,這個與時間的週期有很大關係,一般來看統計週期的時間越久,問題的嚴重程度越高,比如連續3天下降與連續10天下降,問題的嚴重程度不一樣的。

    最後,把握好2個度

    當你搞清楚了問題,並知道問題的嚴重程度時,面試官想要的分析框架也是不同的,框架不同,那薪水的定價自然不一樣。

    1、廣度

    框架,結構化思維,這個能幫助你做什麼?比如我們要分析DAU下降的問題的,其實會有很多假設的,比如圍繞APP來看,把APP當初一個指標,那切分的維度很有很多,對吧,這是分析師的基本要求,分時間、分城市、分使用者型別等

    做發散思維,這都是人類的強項,比如一件事情如果出了問題,我們通常會有N個理由來捍衛自己的利益,發散的好處就是讓我們一定程度能夠做到沒有遺漏,但做不到彼此之間獨立的歸納

    比如圍繞DAU有很多因素的影響,那你如何思考這些因素呢?這些因素在你的框架中是什麼問題,能用“人話”說清楚嗎?這時候我們日常學習的方法論就可以用上了,比如PEST、AAARRR、4P、5W2H等,其實簡單來講就是給你發散的思維要有一個約束的條件或者起點(對新手來講作為起點更好用,對老手來講是約束條件),這樣發散+約束=好的框架

    還有幾個方式,比如按照使用者的行為邏輯來思考、按照部門架構(市場、運營、產品、開發),按照商業元素(使用者、產品、運營)等等

    那其實面試的時候,這個屬於你業務的廣度,考量你對這個業務分析的宏觀的思維過程,這個廣度就需要你瞭解APP各個環節可能出現的問題,並對此進行假設,而這種假設要給它套一個約束條件,那就是我們常說的方法論,這樣的好處就是你把你的分析思維做成了一種標準化商業化的話術。這個看著簡單,但要在面試的時候快速的輸出,還是要有大量的刻意訓練的,冰凍三尺非一日之寒。

    2、深度:

    所謂的深度就是要找你熟悉的一個領域去引導,但實際中情況要複雜的多,可能多個方向綜合對比後給出答案,畢竟是面試,一般人的引導有幾個方向:

    第一步假設:

    假設新增使用者表現好,是因為存量使用者的疲勞造成?

    假設是某些渠道帶來的使用者質量不高造成?

    假設某個地區出現了競爭對手造成?

    第二步:切入點

    使用者切入:新增VS存量

    渠道切入:導航VS搜尋引擎VS聯盟VS商城

    區域切入:省市區

    第三步:驗證假設,找出主要原因,做幾個模擬的結論場景

    1、發現了新增使用者有問題,主要是新增使用者減少導致,然後透過渠道分析得出是搜尋引擎帶來的新使用者減少了X%,明顯大於其他渠道,再分割槽來看,是某一地區出現競爭對手購買我們的關鍵字導致。

    2、分析發現新增使用者的增速雖高,但使用者的質量卻很低,進一步分析新增使用者來源得知,某渠道來的使用者質量相比平均值低X%。3、存量使用者的問題,存量使用者對我們近期APP的運營策略感到不適,第一是變現意圖太明顯(廣告增多),第二是無效資訊推送過多(不是使用者喜歡的)。4、安卓系統升級導致,之前只要使用者選擇聯網時,後臺預設開啟我們的APP,現在安卓系統升級,必須手動操作設定才可以自動開啟

    第四步:在模擬場景中找一個適合秀你的深度邏輯的場景開始

    那2舉例吧,我們第一步的假設得到了驗證,是某渠道來的使用者質量造成的,那接下來繼續假設

    1、渠道有問題,比如刷量、造假資料

    2、渠道沒問題,渠道的使用者畫像和我們產品的畫像不相符,差異太大

    3、渠道沒問題,邊際效用可能存在差異

    ......

    邊際效用這個可能大家不太好理解,可以理解為DAU指數是一個渠道衡量的指數,它與DAU高度相關,而這個指數是要根據使用者的多種行為資料來綜合加權計算,比如使用者落地頁面的瀏覽量、停留時長、回訪、下載到開啟APP的間隔時長等等,也可以描述一下你用的方法,比如因子、主成分、主觀權重、AHP等

    那這裡面其實還延伸出你的幾個認識領域,作弊分析、使用者畫像、綜合評價

    之後要做的就是重複以上的流程,直到整個問題從業務上能說通,從資料上有差異,有思路上有承接關係。

    要是面試的話,沒這麼複雜,其實順著一條線串下來就可以完美地解答,要想辦法在你的思路中體現二個方面實力,1、你瞭解的領域很多,做過很多相關的主題;2、你善於用高階的分析方法解決現實問題;

    實際中要複雜的多,要做好這個專題,那還是需要很多功底的,靠網上那些攻略是遠遠不夠的。問題可深可淺、框架可大可小、方法可易可難,我們常說的資料分析入門容易,深入難就是這個原因,很難說那個好,也很難說那個不好,唯一的衡量就是你老闆對你是否滿意,年年給你加薪升職嗎?真正差異會體現在3年以上,開始不開竅,以後開竅就可能來不及了,年齡不允許....一定想辦法找個前輩帶帶你,會省很多路。

    最後總結一下,先四大角度看“問題”,再2個方向判斷問題嚴重性,最後把握好2個度去分析問題。注意做好,框架大而全,要說人話,分析有深度,圍繞業務流程。

    好了,就寫這麼多吧

  • 中秋節和大豐收的關聯?
  • 有萬花瞳寫輪眼的人能中宇智波鼬的月讀嗎?