这是一篇生成式推荐用于召回场景的工作,其建模范式仍旧是输入端根据用户行为序列构造prompt,输出端预测next item。该工作巧妙地将稀疏ID与稠密向量表征级联融合起来,达到了SOTA水平。
-
基于特征函数的数据蒸馏方法
本篇是CVPR满分作文,聚焦于数据蒸馏工作,创新点在于将数据合成问题建模成对抗性的minmax优化问题。
-
有限预算分配下的01背包问题
有限预算的权益分配本质上是个升级版的背包问题。假设总预算为$C$,用户$i$在券$j$下的核销率是$p_{ij}$,发券面额是$c_{ij}$,我们的求解目标是总预算约束下的订单最大化:
-
自定义CUDA算子融合实现模型推理加速
对模型进行推理加速的最常用方法就是算子融合,这里用个简单demo记录下:
-
用tensorboard支持pytorch训练可视化
在工作用了tensorboard来可视化模型训练过程后,发现还挺香的。另外pytorch也正式支持tensorboard了,这里记录一下。
-
测不准关系
在物理学中,测不准关系(Uncertainty Principle),又称为海森堡不确定性原理(Heisenberg Uncertainty Principle),是由德国物理学家维尔纳·海森堡于1927年提出的量子力学的一个基本原理。这个原理表明,在量子尺度上,某些对易不为零的物理量(比如位置和动量)是不可能同时被精确测量的。
-
SGM: Sequence Generation Model for Multi-Label Classification
为了建模多标签之间的依赖关系,本篇工作用序列生成的方式来解决该问题。
-
DCN
DCN是DeepFM的升级版,后者是只能做二阶交叉特征,随着阶数上升,模型复杂度大幅提高,且FM网络层较浅,表达能力有限。google团队通过构建深度交叉网络来自动进行特征的高阶交叉,且时空复杂度均为线性增长,极大提升了模型性能。
-
小天狼星
小天狼星·布莱克(Sirius Black)是《哈利·波特》系列中的一个重要角色,他是哈利·波特的教父,也是哈利父亲詹姆·波特(James Potter)最好的朋友之一。小天狼星是一个复杂而悲剧性的人物,他的经历和命运贯穿了整个系列。
-
PEPNet
鉴于PEPNet已经是多场景、多任务建模的baseline,这里有必要详细讲解一下。