怎樣來定義流失使用者和流失率？

首頁>Club>2021-10-12 15:23

怎樣來定義流失使用者和流失率？

回覆列表

1 # 拾荒大魔王

一個比喻非常恰當：產品如同蓄水池，使用者好比池中之水。池子中每時每刻都有新使用者源源不斷地加入，也有一部分使用者選擇離開。

如果使用者流失超過新使用者的補給，且速度越來越快、規模越來越大時，產品如若不警惕，蓄水池遲早會乾涸。

這是使用者流失研究的背景。產品階段不同，重心也會從拉新轉移到留存，對於一個成熟的產品和飽和的市場而言，獲取一個新使用者的成本可能是留住一個老使用者的數倍，流失率的降低也意味著營收的增加，在這種條件下，流失研究的價值是顯而易見的。
而研究流失使用者所面臨的主要問題，是如何衡量使用者流失的規模，重中之重是梳理清楚“流失使用者”和“流失率”的定義。或許你腦海中早已經羅列好了幾點困惑：
研究物件是誰：是登入使用者、註冊使用者，還是全部使用者的流失率？流失週期為何：是次日流失率、7日流失率還是月流失率？如何定義流失：1個月沒有訪問的使用者？2個月沒有下單/消費的使用者？還是3個月沒有登入的使用者？
為了給流失一個明確、又能符合產品特徵的定義，並且相對準確地識別出可能流失的使用者，我們引入二元邏輯迴歸作為定量流失研究的模型。

也可以用下圖資料採集與流失預測的時間視窗來理解這一過程。選擇產品中一部分老使用者，觀察和收集他們在一個月內的行為資料（深藍色部分），透過這些資料，我們可以預測其在未來一段時間內（紅色部分）的流失與留存情況。
在預測週期1內出現但週期2未出現的，說明在週期2內流失了，如果兩個週期內都沒有出現，那麼可能在觀察期內就流失了，上述兩種都屬於流失；而週期1和週期2都有出現的使用者，則是留存使用者。

但是，在透過定量模型來研究流失的過程中，往往存在著幾個常見的誤區：

概念誤區：自己研究的物件真的是流失使用者嗎？有多大比例是“偽流失使用者”（迴流使用者&使用間隔大的使用者）？

方法誤區：定量模型的最佳化只能依賴增減指標嗎？是否資料一扔就能一勞永逸？還有哪些方法可以提升模型預測準確性？

應用誤區：流失預警模型只能用於區分流失與非流失使用者？定量資料和流失模型還可以怎樣支撐使用者細化與運營方案？
一、資料僅為工具，產品理解貫穿始終

如何界定流失使用者，避免概念誤區

在構建流失模型時，通常以月作為分析和資料提取的週期，比如在上圖時間視窗中，以連續一個月沒有使用算作流失。但這種簡單粗暴的劃分方法往往會帶來三方面的問題。

1、流失週期受使用者使用間隔決定，不同週期劃分影響使用者結構比例

如果以1個月作為流失週期，那麼十月出現但十一月沒有出現（藍色圓點代表出現）的使用者在十一月流失了，而實際上，他在十二月又出現了，是一個回訪使用者（見回訪3），並沒有真實流失。

如果我們以2個月為週期，則“回訪3”的使用者在10~11月，12月以後兩個週期內都出現過，應該是一個留存使用者。週期劃分對使用者流失界定有著直接影響。
2、如果簡單以一個月為週期進行使用者分類，回訪使用者過多（比如佔總體15%），無法忽視且難以處理

無論以何種週期劃分，必然存在一定比例的回訪使用者，將回訪使用者作為缺失值、算作留存使用者或者作為流失使用者，均對模型準確率有較大影響。

3、流失週期劃分會影響模型的準確率與平衡性

如下表，以總樣本100w為例，分別以4周、5周、6周作為流失標準，劃分出的流失和留存使用者是不同的，對應的流失留存預測準確率也不同。

流失週期過短，流失預測的準確率低，因為定義為流失的使用者中有大量實際留存的使用者，只是其使用間隔長而已（比如以1周沒登入就算流失，但實際上很多留存使用者2~3周才登入一次，也被劃分成流失使用者）；同時週期過短，定義為留存的使用者實際上後來也會流失。
因此，不合理的週期造成預測準確率低且不平衡，我們需要不斷嘗試週期劃分，在保證整體準確率的情況下尋求流失與留存準確率最佳的平衡點，才能更為準確地同時預測流失及留存情況。

如果流失準確率有90%但留存只有50%，那麼雖然我們預測流失的使用者幾乎都是真正會流失的，但可能只識別出了總體使用者中一小部分流失使用者，還有大量流失使用者被劃分在了留存使用者中，導致留存準確率過低。

在這種情況下，選擇恰當的定義方法顯得至關重要。透過查閱資料，我們發現對流失比較經典的定義是“一段時間內未進行關鍵行為的使用者”，關鍵點在於如何界定時間週期（流失週期）和關鍵行為（流失行為）。

我們選擇經典的拐點理論來作為週期界定的參考：
使用者回訪率拐點（使用者回訪率 = 回訪使用者數 ÷ 流失使用者數 × 100%）

同時結合對產品的理解，選擇“主動登入”這一行為作為是否流失的關鍵行為。

但經典的理論也會遇到尷尬：沒有出現拐點怎麼辦？

回訪率拐點可能與產品存在一個平臺期（瓶頸）有關：使用者/玩家處在哪些等級可能流失加劇，或者是線上時長達到多少會產生疲倦加劇流失，哪些角色的使用者更容易流失等等。

比如遊戲，遊戲的特點是：回合、關卡、任務、日常與升級，但這與一些產品長週期、長間隔的使用者使用行為模式並不相同。

在沒有拐點的情況下，可以依據產品經驗或結合模型預測準確率判斷，一般產品的回訪率5%-10%，不管劃分多長的時間週期都會存在回訪，誤差不可避免。
二、指標沒選好，模型調到老

如何最佳化資料模型，避免方法誤區

搭建資料模型的關鍵在於行為資料的選擇，這也是最耗時耗力的地方。在建立模型之前，有必要和資料&開發的同事來一次促膝談心，對資料庫和埋點的情況進行摸底，再次明確一些資料概念的操作化定義，避免發生誤解。

比如，誤解通常來自於以下幾點：
對活躍使用者的定義：是登入使用者、開啟app的使用者還是線上使用者？資料對映和匹配：是按使用者維度（賬號）提取還是按照裝置維度（裝置ID）提取資料？如何處理一個賬戶多臺裝置和一個裝置多個賬戶的關係？資料埋點：登入使用者和匿名使用者（非登入）埋點是否一致？某些關鍵操作（比如主動開啟App）的有無準確埋點？能否區分前臺開啟還是後臺開啟？資料狀態與記錄方式：能否獲取歷史資料，歷史資料是累加記錄還是覆蓋？
可問題往往沒有那麼簡單，即使定義得再精確細緻，模型的準確性也可能不高。如果明白“管中窺豹”這個成語的意思，你很可能找到了答案。

通常我們以一個月為週期，提取使用者一個月內的行為資料。但是產品不同，使用者操作習慣是大相徑庭的，有的產品1個月的時間週期太短，就難以形成足夠的行為資料，好比是盲人摸象，摸到一條尾巴要預測出是一頭大象，的確很有難度。

另一方面，時間過短部分使用者尚在好奇和探索階段，沒有完全沉澱下來成為真正的使用者。反之，如果一味增加提取資料的時間週期，專案執行的時間成本也會水漲船高；同時，等提取週期結束，一些使用者早已流失，即使預測成功也難以挽回。

模型的準確性依賴於資料提取週期問題的解決，我們需要一個使用者多長時間的資料才能準確預測該使用者下一階段的行為？
透過二元邏輯迴歸的ROC曲線可以進行評估，如下圖，6周的資料明顯優於1個月（曲線右下方面積越大預測準確性越高），而2個月的資料只略優於6周，幅度有限，且時間成本較大，因此選擇6周作為資料提取的週期。

第二個難點在於流失原因的分析，也即流失影響因素的選擇。選擇一些具有流失使用者典型特徵的指標維度作為自變數，一步步嘗試修改指標，迭代模型。

如果前期流失模型準確性低，並且流失使用者的特徵與模型的特徵不符，則需要尋找新的流失因素，並納入流失預警模型的提取資料點。指標的選擇，一方面需要不斷試錯，最主要還是基於對業務的理解。

建模過程中的主要問題是模型預測準確性低，我們可以透過檢查是否沒有納入典型的指標維度、是否存在多重共線性來有的放矢地加以解決，有時不顯著的原因可能出乎意料——比如產品功能更新了，或者年底積分折半了，拿到的是被汙染過的資料而不自知。
三、不止預測：模型只是方法而非終點

如何支援使用者運營，避免應用誤區

透過流失預警模型，我們可以獲得產品一系列功能模組或指標對流失留存的影響因子，並計算出每個使用者的流失機率。透過影響因子，我們可以對流失原因有所瞭解，在此基礎上進行深入研究和確認，結合使用者反饋的頻率、專家意見等確定改版的優先順序。

計算流失機率只是一種方法，而不是研究的最終目的，流失研究也不能到此就淺嘗輒止。區分出可能流失的使用者是為了提高挽留策略的針對性，提高效率與減少成本，實現精細化運營——這也是流失模型的核心價值所在。

比如，從使用者使用的輕重程度出發（如上圖），在透過模型計算出使用者未來的流失機率後，將使用App的頻率和時長作為使用者輕重度的劃分標準，結合使用者流失留存預期，將使用者劃分為高價值、重點發展、重點轉化、有待挽留等幾種型別，分析每個型別使用者不同的行為特點和使用痛點，採取針對性的運營策略。
當然，流失模型也可結合付費維度進行研究。先篩選出極有可能將會流失的使用者，再根據購買頻次和付費金額來進行細分。

比如從未付費的使用者可透過優惠券、促銷活動或超低價商品吸引回訪、促成首單購買；少量付費且客單價低的使用者可以精準推送符合個性化偏好的商品，或者推薦符合該使用者消費層次的超值商品；多次付費的老使用者，可以增加會員專屬優惠，透過回饋激勵增強使用者粘性，延長使用週期。

以上只是流失模型的兩個層面的應用，在不同專案中還可以結合多種方式對使用者進行精細化運營。模型準確性高的話，可以用更少的成本、對使用者更少的干擾來留住更有價值的使用者。

當然，提及使用者細分、精細化運營和產品功能體驗的最佳化，又離不開對使用者的理解和對產品業務的積澱。和這種不斷的積澱一樣，流失預警模型也需要不斷地修正和迭代，以適應產品發展的需求。
以模型作為一種研究技術，以對使用者和業務的理解積澱作為基礎，來一起推動產品迭代和運營活動的落地，這兩者都是使用者研究的價值所在。

2 # Angel櫻珞2

App的就是使用者個人認為就是指以個人為單位，下載後又解除安裝的使用者數
流失率就是以個人為單位，用解除安裝的使用者數比上總的下載量，得出的結果為流失率
個人認為流失率在50%以下還算可以，可繼續最佳化。

∧ 中秋節和大豐收的關聯？

∨ 手機莫名其妙的不能通話，只能聽到對方說話是什麼原因？

熱門排行

劇多

怎樣來定義流失使用者和流失率？