首頁>科技>

資料模型是資料平臺的基石,是平臺搭建過程中最最基礎、也是最最重要的環節,為後續資料清洗(ETL)、開發資料報表等工作保駕護航。資料建模做的好,後面工作也會更容易,模型做的不到位,一些報表做起來耗時耗力又吃資源,甚至無法實現。

資料建模一般要經歷主題和主題域分析、概念模型、維度設計、指標整理、邏輯模型、物理模型。

好奇心是內容型產品,有NEWS、LABS兩個頻道,有不同新聞分類和獨立的欄目,商業模式以線上廣告為主。

案例說明

瞭解資料倉庫的,都知道資料倉庫是面向主題,也就是其中的資料是按主題進行組織的。

首先從分析主題入手,主題是在較高層次上對業務資料進行梳理、歸類,一個主題基本對應一個宏觀的分析面。

主題域是確定主題中包括的資料分析範圍及邊界,確定了主題及主題域,資料平臺對外輸出能力也基本確定了。

好奇心業務來說可以分為內容生產運營、營銷、使用者、廣告收入四個方面;再對主題進一步細化出子主題,例如廣告主題可以拆除訂單分析、營收分析、廣告位分析、品牌主分析、業績分析,子主題也就是主題的邊界。

下面我們分別展開說說四個主題的內容:

使用者分析

分基本資訊、行為分析、商業興趣三個子主題。

基本資訊就是常見的人口屬性,包括性別、年齡、地域、職業、職務、月收入等;

商業興趣是指使用者對那些新聞分類、欄目、或者內容主題的喜好程度,可以用於指導內容生產和個性化推薦。

內容運營

可以分為流量分析、內容分析、作者分析、第三方平臺分析。

營銷推廣

分為推廣分析、渠道分析、活動分析。

活動分析一般是市場、運營組織的使用者參與的營銷活動分析、接觸人數、參與人數、轉化人數等等。

廣告收入

分為營收分析、廣告訂單分析、廣告位分析、品牌主分析。

從總收入、訂單、單個廣告位、品牌主、銷售經理、銷售大區不同維度分析收入貢獻,挖掘銷售潛力,降低廣告庫存,提高售賣率和廣告單價。

模型建立

概念模型

是主題的基礎上,識別出主題中的物件,以及建立物件之間的關係,列出物件的較核心的屬性。

例如我們為好奇心日報提煉出產品(App、PC網站、小程式等)、使用者、使用者行為、文章、編輯等物件,並描述了物件之間的關係以及表述物件的核心屬性。

邏輯模型

是將概念模型具象化,為物件增加必要的屬性。

下圖是使用一款線上工具ProcessOn畫的部分邏輯模型,還可以使用更專業的建模工具ERWin和PowerDesigner。

物理模型

是把上述邏輯模型的內容,在具體的物理介質上實現出來,確定欄位型別、取值範圍、採用MySQL、Oracle等建立資料庫表,這裡就不詳細展開介紹。

最後對業務涉及的維度和度量進行梳理,維度越豐富,粒度越細,做資料分析時就可以挖地越深入。

正如資料倉庫權威專家Kimball所說:資料倉庫的能力直接與維度屬性的質量和深度成正比。比如時間維度可以分為季度、月、周、日四個層次,但周和日還可以還可以細化出周天、日時段兩個子維度,彙總一段時間內的週一到週日的啟動次數(日然運營,排除推廣干擾),可以看出使用者從週一到週日的使用規律,同時還可以組合地域,看某一地方使用者週一到週日的使用規律,日時間段同理。當然粒度越細,對資料收集和處理的要求越高。

維度建模

維度建模有專門的方法論,需要根據業務規模、最終需求設計合理的維度模型。

下面是根據業務梳理的維度和度量指標,大家可以嘗試組合下,是否能夠滿足日常運營的需要,如果覺得不夠可以考慮下怎麼擴充套件。

維度

使用者

基本資訊:性別、年齡、職業、職務、月收入、教育、婚姻狀況、子女數、地域

興趣標籤,標籤可分大類、小類

時間

月、周、日、時

日時段

周天

地域

一級、二級、三級城市

北上廣深

Syndication

Toutiao、網易、一點等

Organic

Search、Referral、Direct

Socail

Weixin、Weibo、QQ

營銷渠道

應用分發渠道

廣告推廣

媒體品牌:騰訊、百度、網易……

廣告位名稱

廣告位型別

廣告位平臺:PC、移動

投放創意

Socail

Weixin、Weibo、QQ

SM

Newsletter

活動

Campain List

產品及版本

4.1、4.2

裝置

作業系統、裝置品牌、服務提供商、聯網方式、螢幕解析度

業務

內容分類:頻道(News 、Labs)、新聞分類、欄目

作者、編輯

廣告

廣告平臺:移動平臺、PC平臺

廣告位名稱(App焦點圖、App資訊流、PC)

廣告位型別(移動開屏、移動原生、移動banner、移動插屏、PC頂通、PC焦點圖)

創意形式(640×100單圖、240×180多圖、640×360影片、14字文字鏈)

訂單

廣告主

廣告主所屬行業

指標體系

使用者指標

新增註冊數、活躍使用者數、流失使用者數、登入使用者數、分發平臺粉絲數

流量指標

累計下載量、新增下載量、啟用量、日活數、啟動次數、螢幕瀏覽量、使用時長、留存率、計劃推送數、推送達到數、推送到達率、推送喚醒數、推送喚醒率

行為指標

廣告指標

模型指標

使用者構成(使用者地域、年齡段)、商業興趣

17
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 在小米11釋出之前,回顧下最經典的3部小米數字系列