Beyond Customer Lifetime Valuation: Measuring the Value of Acquisition and Retention for Subscription Services

TL;DR

这篇文章核心是在回答,如何评估营销活动期间的拉新、留存和流失召回的增量LTV。

Introduction

Understanding the incremental value of subscribers is essential to subscription services. Marketing or product investments generally aim to increase acquisition of new subscribers or retention of exist- ing subscribers. The evaluation of these core investments is difficult because the costs of such investments are easily measured, yet the monetary benefits are not obvious. Without the ability to evaluate investments, businesses cannot optimize towards profitable future investments leading to sub optimal business outcomes. This paper develops a methodology to accurately quantify the monetary value of acquired or retained subscribers.

对于订阅服务而言,理解订阅者的增量价值是非常重要的,大多数市场营销或者产品投资都是以获取新订阅用户或者留存已有订阅用户为目标的,但是如何评估这些投资的价值却并不是显而易见的,这会导致后续的商业活动无法朝向最有价值的方向优化。

By definition, subscription-based services grow by acquiring and retaining subscribers. To do so, they may launch new content or fea- tures [2], run marketing campaigns [20], or offer pricing packages that better suit subscriber needs [6]. Measuring the causal impact on acquisition or retention (in units of subscribers) from these interventions can be difficult, but approaches based on randomized control trials [22] or observational studies [16] exist.

获取新订阅用户或者留存已有订阅用户都可以让公司的订阅服务得到增长,因此公司需要生产新的内容或者产品特性、做营销活动、提供更符合用户需求的订阅产品,然而衡量这些干预行为对于拉新或者留存的因果效用十分困难。

However, it is not clear what monetary value to assign to an acquired or retained subscriber. Although it is common practice, we demonstrate that using LTV (or remaining LTV in the case of retention) will tend to overstate the value of acquisition or retention for a subscription business. Instead, we demonstrate that the difference between on and off-service LTV, incremental LTV, is the more appropriate quantity of interest and develop a Markov chain based estimation approach.

通常的做法是采用LTV,或者剩余LTV,但是我们认为这种方式会夸大拉新或者留存对于订阅业务的价值,应该采用 增量LTV 作为衡量标准。

Conceptually, acquiring a new subscriber or retaining an existing subscriber transitions (or saves from the perspective of the business) a customer from an off-service state to an on-service state. Naturally then, the value of that acquisition or retention to the business is the difference between the expected cumulative revenue from that individual in the on-service state and from that same individual if they were in the off-service state. Note crucially that the latter is positive if there is a positive probability of an individual becoming a subscriber when off-service. By using LTV to value acquisition or retention, one is implicitly assuming that the value of off-service states are zero. However, if there is positive probability of a non- subscriber joining, or rejoining, then LTV is likely upwards biased since it fails to subtract the baseline value associated with the off- service state.

概念上说,获取新的订阅用户或者留存已有的订阅用户,都会让一个用户从未订阅的状态转化为订阅的状态,那么拉新或留存的商业价值 可以定义为 处于订阅状态用户期望累计收益 和 处于未订阅状态用户的期望累计收益的差异。

当用户处于未订阅状态但是未来有一定概率成为订阅用户时,此时未订阅状态用户的期望累积收益可能是一个正值,如果只考虑LTV来度 量拉新或者留存的价值时,未订阅用户的未来期望累积收益会被潜在假设为零,此时会夸大拉新和留存的价值。

Methodology

\(V\)表示状态\(s\)下的剩余累计收益(为了方便去掉下标\(s\)) \[ V=\sum_{k=0}^\infty \beta^k \cdot m_k \cdot c_k \] 其中\(m_k\)表示第\(k\)个周期下用户是否订阅,\(c_k\)表示价格,\(\beta\)表示长期的折扣系数。

借鉴因果推断中的潜在结果模型,初始状态\(s\)\(m\)表示用户在下一个周期是订阅用户,\(\neg m\)表示用户在下一个周期不是订阅用户,\(V_m\)表示用户成为订阅用户的潜在LTV,\(V_{\neg m}\)表示用户未成为订阅用户的的潜在LTV,我们要么观测到一个用户成为订阅用户、要么没有成为订阅用户 \[ V=m\cdot V_m +(1-m)\cdot V_{\neg m} \] 假设overlap和unconfoundedness假设成立,状态增量价值为 \[ \mathbb{E}[\Delta V|s] = \mathbb{E}[V|s,m=1] - \mathbb{E}[V|s,m=0] \] 估计增量LTV最主要的困难是估计上面式子的后一项,因为非订阅用户的数据通常非常有限,而且大部分时候很难追踪。为了解决这个问题,我们采用了Markov chain的方式,这样就可以估计非订阅用户的LTV。

假设订阅服务存在两种方案A和B,他们的价格不同,用户付费之后在一定周期内都能够访问公司的产品或者服务,在订阅期结束后,用户会选择续费、升级、降级或者取消服务,我们假设公司可以识别哪些用户曾经订阅过。

方便理解,网上找了一个截图

fig1

基于订阅状态、订阅周期和定于计划,可以定义用户的状态为 \[ \mathbb{S}=\{ 0,A_1,B_1,\cdots,A_N,B_N, A_{-1},B_{-1},\cdots,,A_{-M},B_{-M} \} \] 其中\(A_i\)表示订阅用户处于第\(i\)个连续的订阅周期并且目前处于订阅服务A中,\(A_{-j}\)表示用户之前订阅服务A,已经连续不订阅\(j\)周期了。状态\(0\)表示新用户。\(\mathbb{S}\)各个状态并不重合,同时用户同一时间只会处于其中一个状态。\(N\)\(M\)是足够大的整数,使得 \[ p(A_{i+1}|A_i)\approx A(A_{j+1}|A_{j}),\forall i,j \geq M \]

fig2

上图描绘了订阅服务的Markov chain,状态转移概率是一个\((2N+2M+1)\times(2N+2M+1)\)的矩阵,\(p(s'|s)\)表示从状态\(s\)到状态\(s'\)的状态转移概率。

基于此我们可以计算有限和无限周期下用户的LTV价值。定义\(V(s)\)为状态\(s\)下期望折扣累计收益 \[ V(s)=c(s)+\beta\cdot \sum_{s'} p(s'|s) \cdot V(s') \] 其中\(c(s)\)为状态\(s\)下订阅价格,\(\beta\)是折扣系数。上式可以写作 \[ \bf{(I-\beta P)V=c} \] 因为\(\beta<1\)\(\bf{P}\leq I\),所以\(\bf{(I-\beta P)}\)是可逆矩阵,\(\bf{V}\)有唯一解。

同时也可以计算有限周期下的LTV。第\(k\)步的状态转移概率为 \[ p(s''|s;k)=\prod_{s'} p(s'|s;k-1)p(s''|s';1) \quad \forall k > 1 \] 其中\(p(s'|s;1)=p(s'|s)\),所以有限周期\(T\)下的LTV可以简化为 \[ V_T(s)=\sum_{t=0}^T\beta ^t \sum_{s'}p(s'|s;t)c(s') \] 与之相似,给定初识状态订阅用户分布\(n_0(\cdot)\)\(T\)时刻后用户数为: \[ n_T(s)=\sum_{s'}n_0(s')p(s|s';T) \] 此时总订阅用户数为: \[ S_T=\sum_s n_T(s)\mathbb{I}_\text{on-service}(s) \] 基于上述LTV的定义,我们可以定义拉新或者留存订阅用户的增量价值。

假设开展了一次市场营销活动,我们将拉新与留存都归因于这次活动,那么这次营销活动的商业收益是多少呢?

对于上述Markov chain,我们需要考虑3个渠道,新增订阅、曾今订阅过的用户重新订阅和留存已有的订阅用户。首先我们计算这次营销活动中各个状态的LTV,这是我们考虑了流失风险和重新订阅概率之后,期望从用户身上获得的收益。更加重要的是,我们也可以计算那些没有加入过、重新加入或者流失用户的期望收益。

其中:

  • 获取新的订阅用户,\(\Delta V_\text{acq}(i)=V(i_1)-V(0) \quad i\in\{A,B\}\)
  • 重新激活订阅用户,\(\Delta V_\text{reacq}(i,j,k)=V(i_1)-V\Big(j_{\min\{-M,-k-1\}}\Big) \quad \forall i,j \in\{A,B\},1\leq k\leq M\)
  • 留存已订阅用户,\(\Delta V_\text{ret}(i,j,k)=V\Big(i_{\max\{N,k+1\}}\Big)-V(j_{-1})\quad \forall i,j \in\{A,B\},1\leq k\leq M\)
fig3

这样计算可以考虑用户未来订阅服务的可能性,如果只采用LTV,不减去合适的基础值,会高估拉新和留存的价值。

这种建模方式也会存在一定局限性,比如说整个过程是non-Markov的,可能存在一些历史信息并不能被简单归结成状态,或者我们在状态空间中漏掉一些状态。这些会导致增量LTV难以解释,并且存在一定Bias。可以有两种解决办法来缓解这个问题:

  1. 在原有状态的基础上,多考虑一些变量的影响,去做状态转移概率的预估
  2. 考虑Propensity Score做纠偏

Application

Forecasting Transition Probabilities

本文提出的中间建模方式可以回答一些目前对于订阅服务而言仍是挑战的问题,具体来说,展示了如何预测未来订阅人数、估计价格变动对于业务指标的影响以及如何来平衡当前收益与未来收益来设置更优的价格。

状态转移概率的预估是这个方法的核心,将整个问题分解为一个个状态之间转移概率估计的问题这样做的好处在于,通过选择部分人群,可以最小化未观测到异质性的影响。

最简单的转移概率模型是假设概率在一定周期内是一个常量,然而周期很长时这样的估计方法可能会不准确,比如平台上发行了新的内容,这时潜在的转移概率就会发生改变。所以我们在原有时序模型基础上多考虑一些因素,来最小化\(k\)步的预测误差 \[ p_t(\cdot|s;t)=f_{s'|s}\Big(x_t,p_{t-1}(\cdot|s),\cdots,p_{t-q}(\cdot|s)\Big) \]

Subscriber Forecasting

预测市场渗透率是很有价值的应用场景之一,经典的时间序列预测方法往往缺乏对于市场结构的考虑,无法考虑一些自然约束,如市场饱和导致的增长缓慢。我们通过在一个封闭的系统内建立客户动态模型,以一种简明的方式明确地考虑这些自然约束。随着市场的增长,增长自然会放缓,因为非订阅者的数量在减少。

做到准确预测的关键是选择一个足够庞大的状态集合,以充分刻画整个生命周期的转移概率。然而增加状态数会导致数据变得稀疏,通常来说会有两种解决办法:

  1. 采用降维分组的手段,将转移概率相近或者时间分桶下相邻的状态合并统计
  2. 显示考虑转移矩阵的不确定性

Pricing Application

在基于订阅的服务中,增加收入的两个主要杠杆是涨价和增加订阅用户。在定价方面,价格的设置需要平衡短期的一届收入和用户动态变化对于收入的长期影响。此外价格弹性也会随着订阅者累积订阅时间而变化。价格弹性依赖于不同状态下用户的分布,而用户的分布也影响着价格弹性,这就使得调整价格时需要对价格弹性准确估计。

一般来说,订阅服务很难通过实验来估计价格弹性,不满足SUTVA的假设,很难采用常规的因果推理的手段进行估计。所以我们采用观测数据和Markov chain的建模方式来估计价格变化对于总收入和用户增长的增量效应。

假设我们想知道价格干预后\(k\)个周期后的影响,此时我们已经有收益和订阅用户的数据,需要估计如果没有改变价格时的收益和用户数,根据前几节中,我们采用价格干预前的数据训练模型,并用与干预无关的变量进行预测,收益为 \[ \sum_{s\in\Omega}n_0(s)\hat{V}_k(s)=\sum_{t=0}^k\sum_{s\in\Omega} n_0(s)\beta^t\sum_{s'}\hat{p}_t(s'|s)c(s') \] 反事实订阅用户数为 \[ \hat{S}_k(\Omega)=\sum_{s\in\Omega}n_0(s)\sum_{s'}\hat{p}_k(s'|s)\mathbb{I}_\text{on-service}(s') \]

Optimal Policies

如果可以建模价格弹性\(\frac{\partial p(\cdot|s)}{\partial c}\)和转移概率\(p(\cdot|s)\),那么就可以得到转移概率关于价格的函数\(p(\cdot|s;c)\),给定不同状态上的用户数分布\(n\),最大收益为 \[ V^*(n)=\underset{c\geq 0}{\max} \quad nc + \beta\sum_{n'} V^*(n')p(n'|n;c) \] 假设用户数足够大,那么下一个周期各状态用户分布确定时,上式近似为 \[ V^*(n)=\underset{c\geq 0}{\max} \quad nc + \beta V^*(n)(P(c)n) \] 最优定价策略为 \[ c^*(n)=\underset{c\geq 0}{\arg\max} \quad nc +\beta V^*(P(c)n) \]