RESEARCH27

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

arXiv CS.LG·21 de abril de 2026

Esta pesquisa revela que o ajuste fino LoRA exibe 'desaprendizagem' em exemplos contestados, onde alta discordância de anotadores se correlaciona com o aumento da perda durante o treinamento. Este padrão é distinto do ajuste fino completo e consistentemente observado em vários modelos e conjuntos de dados.

model training Machine Learning NLP Fine-tuning LoRA

Ler original ↗