資料模型是資料平臺的基石,是平臺搭建過程中最最基礎、也是最最重要的環節,為後續資料清洗(ETL)、開發資料報表等工作保駕護航。資料建模做的好,後面工作也會更容易,模型做的不到位,一些報表做起來耗時耗力又吃資源,甚至無法實現。
資料建模一般要經歷主題和主題域分析、概念模型、維度設計、指標整理、邏輯模型、物理模型。
好奇心是內容型產品,有NEWS、LABS兩個頻道,有不同新聞分類和獨立的欄目,商業模式以線上廣告為主。
案例說明
瞭解資料倉庫的,都知道資料倉庫是面向主題,也就是其中的資料是按主題進行組織的。
首先從分析主題入手,主題是在較高層次上對業務資料進行梳理、歸類,一個主題基本對應一個宏觀的分析面。
主題域是確定主題中包括的資料分析範圍及邊界,確定了主題及主題域,資料平臺對外輸出能力也基本確定了。
好奇心業務來說可以分為內容生產運營、營銷、使用者、廣告收入四個方面;再對主題進一步細化出子主題,例如廣告主題可以拆除訂單分析、營收分析、廣告位分析、品牌主分析、業績分析,子主題也就是主題的邊界。
下面我們分別展開說說四個主題的內容:
使用者分析
分基本資訊、行為分析、商業興趣三個子主題。
基本資訊就是常見的人口屬性,包括性別、年齡、地域、職業、職務、月收入等;
商業興趣是指使用者對那些新聞分類、欄目、或者內容主題的喜好程度,可以用於指導內容生產和個性化推薦。
內容運營
可以分為流量分析、內容分析、作者分析、第三方平臺分析。
營銷推廣
分為推廣分析、渠道分析、活動分析。
活動分析一般是市場、運營組織的使用者參與的營銷活動分析、接觸人數、參與人數、轉化人數等等。
廣告收入
分為營收分析、廣告訂單分析、廣告位分析、品牌主分析。
從總收入、訂單、單個廣告位、品牌主、銷售經理、銷售大區不同維度分析收入貢獻,挖掘銷售潛力,降低廣告庫存,提高售賣率和廣告單價。
模型建立
概念模型
是主題的基礎上,識別出主題中的物件,以及建立物件之間的關係,列出物件的較核心的屬性。
例如我們為好奇心日報提煉出產品(App、PC網站、小程式等)、使用者、使用者行為、文章、編輯等物件,並描述了物件之間的關係以及表述物件的核心屬性。
邏輯模型
是將概念模型具象化,為物件增加必要的屬性。
下圖是使用一款線上工具ProcessOn畫的部分邏輯模型,還可以使用更專業的建模工具ERWin和PowerDesigner。
物理模型
是把上述邏輯模型的內容,在具體的物理介質上實現出來,確定欄位型別、取值範圍、採用MySQL、Oracle等建立資料庫表,這裡就不詳細展開介紹。
最後對業務涉及的維度和度量進行梳理,維度越豐富,粒度越細,做資料分析時就可以挖地越深入。
正如資料倉庫權威專家Kimball所說:資料倉庫的能力直接與維度屬性的質量和深度成正比。比如時間維度可以分為季度、月、周、日四個層次,但周和日還可以還可以細化出周天、日時段兩個子維度,彙總一段時間內的週一到週日的啟動次數(日然運營,排除推廣干擾),可以看出使用者從週一到週日的使用規律,同時還可以組合地域,看某一地方使用者週一到週日的使用規律,日時間段同理。當然粒度越細,對資料收集和處理的要求越高。
維度建模
維度建模有專門的方法論,需要根據業務規模、最終需求設計合理的維度模型。
下面是根據業務梳理的維度和度量指標,大家可以嘗試組合下,是否能夠滿足日常運營的需要,如果覺得不夠可以考慮下怎麼擴充套件。
維度
使用者
基本資訊:性別、年齡、職業、職務、月收入、教育、婚姻狀況、子女數、地域
興趣標籤,標籤可分大類、小類
時間
月、周、日、時
日時段
周天
地域
省
一級、二級、三級城市
北上廣深
Syndication
Toutiao、網易、一點等
Organic
Search、Referral、Direct
Socail
Weixin、Weibo、QQ
營銷渠道
應用分發渠道
廣告推廣
媒體品牌:騰訊、百度、網易……
廣告位名稱
廣告位型別
廣告位平臺:PC、移動
投放創意
Socail
Weixin、Weibo、QQ
SM
Newsletter
活動
Campain List
產品及版本
4.1、4.2
裝置
作業系統、裝置品牌、服務提供商、聯網方式、螢幕解析度
業務
內容分類:頻道(News 、Labs)、新聞分類、欄目
作者、編輯
廣告
廣告平臺:移動平臺、PC平臺
廣告位名稱(App焦點圖、App資訊流、PC)
廣告位型別(移動開屏、移動原生、移動banner、移動插屏、PC頂通、PC焦點圖)
創意形式(640×100單圖、240×180多圖、640×360影片、14字文字鏈)
訂單
廣告主
廣告主所屬行業
指標體系
使用者指標
新增註冊數、活躍使用者數、流失使用者數、登入使用者數、分發平臺粉絲數
流量指標
累計下載量、新增下載量、啟用量、日活數、啟動次數、螢幕瀏覽量、使用時長、留存率、計劃推送數、推送達到數、推送到達率、推送喚醒數、推送喚醒率
行為指標
廣告指標
模型指標
使用者構成(使用者地域、年齡段)、商業興趣