heapsort
RESEARCH27

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

arXiv CS.LG·21 de abril de 2026

Esta pesquisa revela que o ajuste fino LoRA exibe 'desaprendizagem' em exemplos contestados, onde alta discordância de anotadores se correlaciona com o aumento da perda durante o treinamento. Este padrão é distinto do ajuste fino completo e consistentemente observado em vários modelos e conjuntos de dados.

Ler original