← heapsort-ai

model adaptation

4 items

RESEARCHarXiv CS.LG·01/05/2026

Simple Self-Conditioning Adaptation for Masked Diffusion Models

Modelos de difusão mascarada (MDMs) descartam previsões para tokens que permanecem mascarados, limitando o refinamento entre passos. Este artigo propõe os Modelos de Difusão Mascarada Auto-Condicionados (SCMDM), uma adaptação pós-treinamento que condiciona cada passo de denoising nas previsões anteriores do próprio modelo. Isso melhora o desempenho sem mudanças arquitetônicas significativas ou avaliações adicionais.

27
RESEARCHarXiv CS.CL·27/04/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Esta pesquisa investiga sistematicamente a colocação de LoRA em modelos de linguagem híbridos que combinam atenção e componentes recorrentes. O estudo revela que adaptar o caminho da atenção supera consistentemente a adaptação do modelo completo com menos parâmetros, e o impacto da adaptação do componente recorrente difere significativamente entre arquiteturas híbridas sequenciais e paralelas.

27
RESEARCHarXiv CS.CL·27/04/2026

Knowledge-driven Augmentation and Retrieval for Integrative Temporal Adaptation

O KARITA (Knowledge-driven Augmentation and Retrieval for Integrative Temporal Adaptation) é um sistema desenvolvido para enfrentar os desafios das mudanças temporais em modelos de IA, que são treinados com dados históricos mas implantados em dados futuros. Ele integra aumento e recuperação impulsionados pelo conhecimento para capturar diversas mudanças e aproveitar insights para uma adaptação temporal aprimorada em múltiplos domínios.

27