PEFT-LISA | Swift's Blog

PEFT-LISA

Swift Lv6

2024-04-03 01:16:50 2024-04-03 01:16:50

NLP

LLM
PEFT

LISA是LoRA的简化版，但其抓住了LoRA微调的核心，即LoRA侧重更新LLM的底层embedding和顶层head。

phe

根据上述现象，LISA提出两点改进：

始终更新LLM的底层embedding和顶层head
随机更新中间层的hidden state

phe

实验结果

显存占用

gpu

毕竟模型参数大头还是在底层embedding，所以显存占用并没有减少太多。

训练时间

time

下游任务微调

time

在MT-BENCH上，LISA超过了LoRA，甚至全量参数微调。

参考

1. 实验结果

1. 实验结果