model adaptation

4 items

RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Modelos de difusão mascarada (MDMs) descartam previsões para tokens que permanecem mascarados, limitando o refinamento entre passos. Este artigo propõe os Modelos de Difusão Mascarada Auto-Condicionados (SCMDM), uma adaptação pós-treinamento que condiciona cada passo de denoising nas previsões anteriores do próprio modelo. Isso melhora o desempenho sem mudanças arquitetônicas significativas ou avaliações adicionais.

Diffusion Models model adaptation deep learning machine learning

RESEARCHarXiv CS.CL·27/04/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Esta pesquisa investiga sistematicamente a colocação de LoRA em modelos de linguagem híbridos que combinam atenção e componentes recorrentes. O estudo revela que adaptar o caminho da atenção supera consistentemente a adaptação do modelo completo com menos parâmetros, e o impacto da adaptação do componente recorrente difere significativamente entre arquiteturas híbridas sequenciais e paralelas.

hybrid language models model adaptation attention mechanisms Recurrent Neural Networks

RESEARCHarXiv CS.CL·27/04/2026

Knowledge-driven Augmentation and Retrieval for Integrative Temporal Adaptation

O KARITA (Knowledge-driven Augmentation and Retrieval for Integrative Temporal Adaptation) é um sistema desenvolvido para enfrentar os desafios das mudanças temporais em modelos de IA, que são treinados com dados históricos mas implantados em dados futuros. Ele integra aumento e recuperação impulsionados pelo conhecimento para capturar diversas mudanças e aproveitar insights para uma adaptação temporal aprimorada em múltiplos domínios.

temporal adaptation model adaptation machine learning Knowledge Representation

RESEARCHarXiv CS.LG·25d atrás

EMA: Efficient Model Adaptation for Learning-based Systems

Este artigo apresenta EMA, o primeiro sistema de adaptação de modelos que apoia sistemas baseados em aprendizagem para se ajustarem a ambientes em evolução com sobrecarga operacional mínima. Ele reduz o treinamento de modelos caros e os desafios de coleta de dados, abordando importantes desafios de implantação.

model adaptation system optimization learning machine learning