EOM公式推导
Swift Lv6

在uplift建模中,除了AUUC、QINI指标,还有EOM。它是基于离线RCT模拟评估在线业务收益的指标,EOM越高,业务收益越高。

在这里记录下EOM的公式推导。

EOM

这个推导依赖于概率论中的两个核心概念

  1. 全期望定律 (Law of Total Expectation)
  2. 随机实验中的独立性 (Independence in Randomized Experiments)

目标: 证明 $\text{E}[Z] = \text{E}[Y | T = h(\mathbf{X})]$

其中,随机变量 $Z$ 的定义为:

这里 $p_t = P(T=t)$ 是用户被分配到干预 $t$ 的概率。

第一步:代入 $Z$ 的定义并利用期望的线性性

期望 $\text{E}[\cdot]$ 具有线性性,因此我们可以将期望 $\text{E}[Z]$ 拆分成和式的期望:

将求和 $\sum$ 和常量 $\frac{1}{p_t}$ 移出期望:

第二步:利用全期望定律和指示函数

根据概率论中对随机变量乘积期望的定义,两个指示函数 $\mathbb{I}\{A\}$ 和 $\mathbb{I}\{B\}$ 相乘,等价于条件 $A$ 和 $B$ 同时成立

利用全期望定律,将期望写成 联合概率的积分 形式:

将这个结果代回 $(*)$:

第三步:利用随机实验的独立性

在RCT样本中,用户被分配到干预组 $T$ 的过程是独立于用户的特征 $\mathbf{X}$(以及模型基于 $\mathbf{X}$ 的预测 $h(\mathbf{X})$)的。

因此,事件 $\{h(\mathbf{X})=t\}$ 和 $\{T=t\}$ 是相互独立的。

根据独立性,联合概率可以分解:

回顾全期望定律:$\text{E}[A] = \sum_{i} \text{E}[A | B=b_i] P(B=b_i)$。

在营销场景的在线运筹中,$h(X) = t$ 表示运筹出一张券面额,如果实发面额$T$也等于$t$,那么$z=\frac{Y}{p_t}$,这样即可模拟出在线业务收益。$p_t$是该treatment的样本分布占比,$\frac{1}{p_t}$表示IPW,从而避免样本不均的影响。


参考

Powered by Hexo & Theme Keep
This site is deployed on
Unique Visitor Page View