Swift's Blog

斯诺克专业术语

恭喜赵心童夺得世锦赛冠军！借此机会整理了完整的斯诺克术语表格，包含基本规则、杆法技巧、球桌区域、战术策略、装备术语等：
2025-05-14 11:23:11
随笔
Snooker
Read more
策略梯度与Q-Learning的区别

PG和Q-Learning都是RL的两大主流算法，记录下两者差异。
2025-04-27 02:33:34
Reinforcement Learning
Q-Learning

Policy Gradient
Read more
矩阵的秩

矩阵的秩（Rank）是线性代数中的一个重要概念，表示矩阵中线性无关的行（或列）的最大数量。它反映了矩阵所包含的“有效信息”的维度，矩阵秩越大，代表其有效信息越多，自由度越高。
2025-04-21 22:27:43
Machine Learning
Matrix

Rank
Read more
赛睿鼠标设置宏

鼠标宏是一种自动化脚本，用于记录并重复执行一系列鼠标操作（如点击、移动、滚轮滚动等），以提高操作效率或实现复杂操作。它通常用于游戏、办公自动化、设计等领域。记录一下赛睿鼠标的宏设置。
2025-04-21 01:47:31
tools
SteelSeries

Macro
Read more
IPW逆概率加权

IPW是个非常优雅的纠偏方法。下面介绍如何利用它来实现纠偏：
2025-04-21 11:23:11
Marketing
IPW
Read more
各开源协议一览

在 GitHub 上，开源项目通常会使用一些常见的开源协议来定义项目的使用、修改和分发规则。以下是目前 GitHub 上最常见的几种开源协议及其差异和示例说明：
2025-04-07 20:11:02
随笔
Open Source License
Read more
COBRA详解

这是一篇生成式推荐用于召回场景的工作，其建模范式仍旧是输入端根据用户行为序列构造prompt，输出端预测next item。该工作巧妙地将稀疏ID与稠密向量表征级联融合起来，达到了SOTA水平。
2025-04-03 00:24:38
搜广推
LLM

Generative Recommendation
Read more
基于特征函数的数据蒸馏方法

本篇是CVPR满分作文，聚焦于数据蒸馏工作，创新点在于将数据合成问题建模成对抗性的minmax优化问题。
2025-04-02 01:02:37
Machine Learning
Data Distillation
Read more
有限预算分配下的01背包问题

有限预算的权益分配本质上是个升级版的背包问题。假设总预算为$C$，用户$i$在券$j$下的核销率是$p_{ij}$，发券面额是$c_{ij}$，我们的求解目标是总预算约束下的订单最大化：
2025-03-29 03:47:21
Marketing
Dynamic Programming
Read more
自定义CUDA算子融合实现模型推理加速

对模型进行推理加速的最常用方法就是算子融合，这里用个简单demo记录下：
2025-03-28 03:34:18
Machine Learning
CUDA
Read more

/24