在uplift建模中,除了AUUC、QINI指标,还有EOM。它是基于离线RCT模拟评估在线业务收益的指标,EOM越高,业务收益越高。
在这里记录下EOM的公式推导。

这个推导依赖于概率论中的两个核心概念:
- 全期望定律 (Law of Total Expectation)
- 随机实验中的独立性 (Independence in Randomized Experiments)
目标: 证明 $\text{E}[Z] = \text{E}[Y | T = h(\mathbf{X})]$
其中,随机变量 $Z$ 的定义为:
这里 $p_t = P(T=t)$ 是用户被分配到干预 $t$ 的概率。
第一步:代入 $Z$ 的定义并利用期望的线性性
期望 $\text{E}[\cdot]$ 具有线性性,因此我们可以将期望 $\text{E}[Z]$ 拆分成和式的期望:
将求和 $\sum$ 和常量 $\frac{1}{p_t}$ 移出期望:
第二步:利用全期望定律和指示函数
根据概率论中对随机变量乘积期望的定义,两个指示函数 $\mathbb{I}\{A\}$ 和 $\mathbb{I}\{B\}$ 相乘,等价于条件 $A$ 和 $B$ 同时成立。
利用全期望定律,将期望写成 联合概率的积分 形式:
将这个结果代回 $(*)$:
第三步:利用随机实验的独立性
在RCT样本中,用户被分配到干预组 $T$ 的过程是独立于用户的特征 $\mathbf{X}$(以及模型基于 $\mathbf{X}$ 的预测 $h(\mathbf{X})$)的。
因此,事件 $\{h(\mathbf{X})=t\}$ 和 $\{T=t\}$ 是相互独立的。
根据独立性,联合概率可以分解:
回顾全期望定律:$\text{E}[A] = \sum_{i} \text{E}[A | B=b_i] P(B=b_i)$。
在营销场景的在线运筹中,$h(X) = t$ 表示运筹出一张券面额,如果实发面额$T$也等于$t$,那么$z=\frac{Y}{p_t}$,这样即可模拟出在线业务收益。$p_t$是该treatment的样本分布占比,$\frac{1}{p_t}$表示IPW,从而避免样本不均的影响。