-
M1 Mac安装Homebrew
Homebrew对ARM芯片的Mac支持不友好,这里切换到国内镜像网站安装,速度快且稳定,没有乱七八糟的报错: 1/bin/bash -c "$(curl -fsSL https://gitee.com/ineo6/homebrew-ins... -
多模态大模型-从BLIP到LLaVA
多模态大模型方面的经典工作:多模态大模型: 盘点&Highlights part1——从BLIP到LLaVA -
点沙成硅
将一粒沙子转化为芯片的过程是一个复杂而精密的制造流程。芯片制造始于原材料硅的提纯,然后经过多步骤的工艺,最终变成用于计算机、手机等设备的半导体芯片。以下是这个过程的主要步骤:
-
U-Net原理及代码实现
U-Net是医疗领域进行语义分割的利器,随着AIGC的爆火,U-Net已成为Diffusion Model的backbone,有必要详细记录下。
-
Mixtral MoE代码解读
一直对稀疏专家网络好奇,有些专家没被选中,那么梯度是否为0,这一轮被选中有梯度,下一轮没被选中无梯度,模型可以训练收敛吗?
-
千卡GPU训练难点
没吃过猪肉,但也要见识下猪跑:你的真实姓名的回答 千卡训练经验的含金量:Frossmann的回答 -
常见金融术语
https://m.cfa.cn/cfa/2413.html -
DSSM双塔特征交互
传统的DSSM双塔无法在早期进行user和item侧的特征交互,这在一定程度上降低了模型性能。我们想要对双塔模型进行细粒度的特征交互,同时又不失双塔模型离线建向量索引的解耦性。下面介绍两篇这方面的工作。
-
Learn To Rank
在信息检索中,给定一个query,搜索引擎召回一系列相关的Documents,然后对这些Documents进行排序,最后将Top N的Documents输出。
-
两种神经网络参数初始化方法
重点介绍一下Xavier和Kaiming初始化: