回覆列表
  • 1 # 理想的奔跑者

    (一)問題識別

      大資料分析的第一步是要清晰界定需要回答的問題。對問題的界定有兩個標準,一是清晰、二是符合現實。

      (二)資料可行性論證

      論證現有資料是否足夠豐富、準確,以致可以為問題提供答案,是大資料分析的第二步,專案是否可行取決於這步的結論。大資料和傳統資料的生成方式有本質不同。傳統資料往往是在識別問題、根據問題設計問卷、之後展開調查獲得的資料,而大資料卻是企業或者個體各類活動產生的附屬產品。作為附屬產品,大資料往往不是為了特定資料專案生成,也存在較高噪音。這就要求資料可行性論證過程需要仔細推敲,現有資料得出來的結論是否足夠可靠。由於大資料分析技術本質屬於資料探勘法,過度擬合問題往往是大資料分析的難點。

      因此,在資料可行性論證主要涉及三個環節。第一,釐清專案需要的大資料、小資料和專業知識;第二,完成從抽象概念到具體指標的落實;第三,考察資料的代表性。

      (三)資料準備

      資料準備環節需要梳理分析所需每個條目的資料,為下一步建立模型做好從充分預備。這種準備可以分為資料的採集準備和清洗整理準備兩步。

      1.資料的採集準備

      為大資料分析做資料採集準備時,往往不能迴避下列問題:專案的資料預算有多少?配備的人員裝置是否足夠?專案預期資料採集的完成期限?專案打算用什麼方法收集資料?哪些資料是可以透過自身努力來獲取,哪些資料需要透過購買獲得?哪些資料獲取中會存在時間和經費上的不確定性?如果一些重要問題的答案是否定的或者含糊的,就可能需要重新回到資料可行性論證環節。這一點,對於希望用大資料分析做產品的小微企業、新創企業尤為重要。

      2.資料的清洗整理準備

      雖然資料清理包含不少常規處理,但是高質量的資料清理工作需要資料準備團隊時刻對專案目標瞭然於胸。

      (四)建立模型

      大資料分析專案需要建立的模型可以分為兩類。對於這兩類模型,團隊都需要在設立模型、論證模型的可靠性方面下功夫。

      1.專業領域模型

      大資料產品對應的專案可能有對應的專業領域模型,例如PEST分析模型、5W2H分析模型、邏輯樹分析模型、4P營銷理論模型、使用者行為模型等。資料團隊需要明確為何選擇某個專業領域的模型。

      2.資料分析模型

      建立模型時既需要強大運算能力,也需要專家的主觀判斷。

      (五)評估結果

      評估結果階段是要評估上述步驟得到的結果是否足夠嚴謹可靠,並確保資料分析結果能夠有利於決策。評估結果包括定量評估和定性評估兩部分。

      1.定量評估

      定量評估是關注主觀標準的可靠性。資料探勘分析方法在計算上雖然依靠技術,但不少關鍵節點依靠主觀標準。

      2.定性評估

      定性評估的重點是考察大資料分析的結果是否合理、方案是否可行。

      在評估大資料分析的結果時,由於定性評估往往需要一段時間之後才能完成,因此將大資料分析結果用於現實時,需要採取審慎步驟。

      大資料分析五步法流程順序.以上五大步驟構成一個完整的資料分析過程,中琛魔方大資料分析平臺(www.zcmorefun.com)表示從開始思考目標到最後視覺化呈現,從發現問題到提出解決方案,身為資料運營者,我們既需要有整體思維,能夠從全流程去把握資料分析方法,也需要對細節極致追求,最佳化每一個步驟。當我們能夠從整體和細節都遊刃有餘得進行資料分析的時候,你就是一個合格甚至優秀的資料運營者。

  • 中秋節和大豐收的關聯?
  • 養羊的最佳方法和技巧?