RESEARCH27
Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning
arXiv CS.LG·21 de abril de 2026
Esta investigación descubre que el ajuste fino LoRA provoca 'desaprendizaje' en ejemplos controvertidos, donde una alta discrepancia de anotadores se correlaciona con un aumento de la pérdida durante el entrenamiento. Este patrón es distinto del ajuste fino completo y se observa consistentemente en varios modelos y conjuntos de datos.
Leer original ↗