Uplift Tree建模
决策树构建流程:
1. 节点划分
在每个树节点上,遍历所有特征以及该特征下的所有取值,以最大化实验组和对照组之间的转化率差异。
2. 增益计算
每个节点根据实验组和对照组在该特征下的转化率差异来计算增益。例如,某一群体可能在干预下表现出更高的购买率,而另一群体则没有显著变化。增益计算公式如下:
- $P^T(Y)$表示实验组样本中类别$Y$的概率
- $P^C(Y)$表示对照组样本中类别$Y$的概率
- $D$表示度量距离,可以欧氏距离、KL散度等
- $D_{\text {after }_{\text {split }}}\left(P^T(Y), P^C(Y)\right)$ 即为该叶子节点的uplift值,一般都是$P^T(Y) - P^C(T)$
3. 增益预测
给定一用户,根据该用户的所有特征以及该特征下的所有取值,将其分配到某一个叶子节点,得到该用户的uplift值。