← heapsort-ai

attention

2 items

RESEARCHarXiv CS.LG·21/04/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Este artigo investiga como os métodos de adaptação (Full FT vs. LoRA) e a escala de otimização afetam o "attention drift" e a retenção de transferência em modelos CLIP ajustados. Através de uma comparação de taxas de aprendizado controladas, ele revela que a taxa de aprendizado modula fortemente a mudança estrutural, com o Full FT mostrando contração acentuada em taxas mais altas, enquanto o LoRA mantém entropia positiva.

27