RESEARCH27

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

arXiv CS.LG·21 de abril de 2026

Esta investigación descubre que el ajuste fino LoRA provoca 'desaprendizaje' en ejemplos controvertidos, donde una alta discrepancia de anotadores se correlaciona con un aumento de la pérdida durante el entrenamiento. Este patrón es distinto del ajuste fino completo y se observa consistentemente en varios modelos y conjuntos de datos.

model training machine learning NLP Fine-tuning LoRA

Leer original ↗