介绍一下阿里巴巴在CVR领域多任务学习的三篇论文:
-
搜广推场景下的长序列建模问题
用户序列长度跟模型AUC有直接正相关性,模型能处理的序列长度越长,AUC就越高。但长序列对于样本处理和模型训练非常不友好,耗时长且显存占用大。更重要的是线上预估服务的约束,必须要在规定时间内完成推算。针对长序列的建模,出现了如下代表性工作:
-
curl发送post请求存在变量转义的问题
最近在使用
curl
发送post请求的时候,需要带上自定义的变量,示例如下:1
2
3
4
5name="Tom"
age=18
msg="my name is ${name}, age is ${age}"
echo ${msg}
curl -X POST "http://xxx.com" -H "Content-Type:application/json" -d "{\"message\":{\"header\":{\"body\":[{\"type\":\"TEXT\",\"content\":\"${msg}\"}]}}" -
graphsage解读
传统的图方法都是直推式(transductive)的,学习到的是结构固定的图模型,一旦有新的节点加入,便需要重新训练整个图网络,泛化性不强。GraphSAGE是归纳式(inductive)的,它学习一种映射:通过采样和聚合邻居节点信息来生成当前节点的表征。GraphSAGE可扩展性更强,对于节点分类和链接预测问题的表现也十分突出。
-
DIN解读
传统的Embedding&MLP架构将用户特征编码进一个固定长度的向量。当推出一个商品时,该架构无法捕捉用户丰富的历史行为中的多样性兴趣与该商品的关联。阿里妈妈团队提出了DIN网络进行改进,主要有如下两点创新:
-
MoCo解读
MoCo方法由何凯明团队提出,是无监督对比学习的代表作。经过MoCo预训练的视觉表征迁移到各种下游任务时,其效果超过了有监督预训练模型。
-
date命令基本使用
在维护一些定时脚本任务的时候,经常需要使用该命令。在此做一个记录:
-
shell并发编程
实际上
&
符号就表示将程序放入后台执行,从而实现多个程序并行。但由于机器资源有限,我们需要控制并发数量。下面是解决方案: -
git tag使用
git tag主要用来标记某个提交,用法非常简单。
-
thread_local用法
C++11 thread_local用法