本文探索了专家网络的差异性对模型性能的影响,本质上是种bagging思想,从各个语义空间上提升模型的表达能力。
-
模型预估打分对运筹跟踪的影响
在uplift建模中,模型离线指标(QINI、AUUC)提升并不意味着在线A/B实验的收益,因为在线运筹还需要$\lambda$约束。如果模型打分不满足单调增且roi边际递减,那么$\lambda$运筹求解会非常不稳定,导致线上发券偏高,毛利无法兜住。
-
生成式召回-TIGER范式
TIGER(Transformer Index for Generative Recommenders)是生成式召回的经典力作,其核心思想就是语义ID+Seq2Seq,这一范式启发了后续大量生成式推荐工作。
-
codebook简史
一文详解 codebook 技术史(从 VAE 到 VQ/RQ-VAE 到 FSQ) -
离线运筹求解流程
基于线上运筹优化公式推导,概述一下如何用二分搜索来运筹求解 $\lambda$ 。
-
扭矩&马力
马力和扭矩是衡量发动机性能的两个核心指标,但它们的物理意义和对车辆性能的影响截然不同。
-
FLOPS、FLOPs、TOPS概念
在计算性能和硬件指标中,FLOPS、FLOP/s、TOPS 是常见的术语,但它们有明确的区别和应用场景。以下是详细解析:
-
光锥
在物理学中,光锥(Light Cone)是描述时空中因果关系的一个几何结构,来源于相对论,尤其是狭义相对论和广义相对论中的时空图像。
-
三体问题
从物理学角度,三体问题之所以不稳定,是因为三个天体在万有引力作用下相互作用,形成一个非线性耦合系统。我们可以从牛顿经典力学出发,列出具体的运动方程,并说明为何这个系统本质上是混沌的,无法得到一般解析解。
-
对数正态分布LogNormal
如果$\ln X \sim \mathcal{N}(\mu, \sigma^2)$,那么$X$服从对数正态分布,它的PDF是:$\frac{1}{x \sigma \sqrt{2\pi}} \exp \left( -\frac{(\ln x - \mu)^2}{2\sigma^2} \right)$