Swift's Blog

IPW逆概率加权

IPW是个非常优雅的纠偏方法。下面介绍如何利用它来实现纠偏：
2025-04-21 11:23:11
Marketing
IPW
Read more
各开源协议一览

在 GitHub 上，开源项目通常会使用一些常见的开源协议来定义项目的使用、修改和分发规则。以下是目前 GitHub 上最常见的几种开源协议及其差异和示例说明：
2025-04-07 20:11:02
随笔
Open Source License
Read more
COBRA详解

这是一篇生成式推荐用于召回场景的工作，其建模范式仍旧是输入端根据用户行为序列构造prompt，输出端预测next item。该工作巧妙地将稀疏ID与稠密向量表征级联融合起来，达到了SOTA水平。
2025-04-03 00:24:38
搜广推
LLM

Generative Recommendation
Read more
基于特征函数的数据蒸馏方法

本篇是CVPR满分作文，聚焦于数据蒸馏工作，创新点在于将数据合成问题建模成对抗性的minmax优化问题。
2025-04-02 01:02:37
Machine Learning
Data Distillation
Read more
有限预算分配下的01背包问题

有限预算的权益分配本质上是个升级版的背包问题。假设总预算为$C$，用户$i$在券$j$下的核销率是$p_{ij}$，发券面额是$c_{ij}$，我们的求解目标是总预算约束下的订单最大化：
2025-03-29 03:47:21
Marketing
Dynamic Programming
Read more
自定义CUDA算子融合实现模型推理加速

对模型进行推理加速的最常用方法就是算子融合，这里用个简单demo记录下：
2025-03-28 03:34:18
Machine Learning
CUDA
Read more
用tensorboard支持pytorch训练可视化

在工作用了tensorboard来可视化模型训练过程后，发现还挺香的。另外pytorch也正式支持tensorboard了，这里记录一下。
2025-03-22 03:00:23
PyTorch
TensorBoard

Visualization
Read more
测不准关系

在物理学中，测不准关系（Uncertainty Principle），又称为海森堡不确定性原理（Heisenberg Uncertainty Principle），是由德国物理学家维尔纳·海森堡于1927年提出的量子力学的一个基本原理。这个原理表明，在量子尺度上，某些对易不为零的物理量（比如位置和动量）是不可能同时被精确测量的。
2025-03-13 18:35:09
Physics
Uncertainty Principle
Read more
SGM: Sequence Generation Model for Multi-Label Classification

为了建模多标签之间的依赖关系，本篇工作用序列生成的方式来解决该问题。
2025-03-09 02:44:40
NLP
Multi-label Classification

LSTM
Read more
DCN

DCN是DeepFM的升级版，后者是只能做二阶交叉特征，随着阶数上升，模型复杂度大幅提高，且FM网络层较浅，表达能力有限。google团队通过构建深度交叉网络来自动进行特征的高阶交叉，且时空复杂度均为线性增长，极大提升了模型性能。
2025-03-02 23:13:38
搜广推
Cross-Features
Read more

/23