← heapsort-ai

Fine-tuning

59 items

RESEARCHarXiv CS.LG·21/4/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Este estudio analiza cómo los métodos de adaptación (Full FT vs. LoRA) y la escala de optimización influyen en la deriva de atención y la retención de transferencia en modelos CLIP ajustados. Una comparación controlada de tasas de aprendizaje revela que la tasa de aprendizaje modula fuertemente el cambio estructural, con Full FT mostrando una marcada contracción a tasas más altas, mientras que LoRA permanece con entropía positiva.

27
RESEARCHarXiv CS.CL·21/4/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT es un nuevo marco de ajuste fino por instrucción que busca mejorar el aprendizaje en contexto de los LLM para tareas de PNL longitudinales, que requieren razonamiento sobre texto ordenado temporalmente. Emplea un currículo que aumenta progresivamente la dificultad temporal, incorporando estructura de pocas-muestras y condicionamiento temporal, superando consistentemente a los modelos base en diversos conjuntos de datos y tamaños de parámetros.

27
RESEARCHarXiv CS.LG·hace 27d

Rotation-Preserving Supervised Fine-Tuning

Este artículo propone el "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) para mejorar la generalización fuera del dominio en modelos de lenguaje grandes. Penaliza los cambios en los subespacios singulares preentrenados, ofreciendo un proxy eficiente para las direcciones sensibles de Fisher y superando las líneas base de SFT estándar.

27
RESEARCHarXiv CS.CL·hace 26d

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Este estudio explora estrategias para adaptar grandes modelos de lenguaje (LLMs) de propósito general a dominios de ingeniería especializados, específicamente la fabricación aditiva, para mejorar la precisión y relevancia de las respuestas. Investiga el uso de ajuste fino específico del dominio y generación aumentada por recuperación (RAG), construyendo un corpus curado para evaluación.

27
RESEARCHarXiv CS.CL·hace 8d

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Esta investigación explora cómo la adaptación de dominio remodela el comportamiento explicativo en modelos de lenguaje, utilizando la cosmología histórica como un entorno controlado. El estudio implica entrenar un modelo pequeño desde cero y ajustar un modelo más grande para analizar el marco explicativo y la postura cosmológica.

27
RESEARCHarXiv CS.LG·hace 15d

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Esta investigación presenta FuRA (Full-Rank Adaptation), un nuevo método de ajuste fino eficiente en parámetros que aborda las limitaciones de las técnicas existentes mediante el preacondicionamiento espectral. Al reparametrizar matrices de peso a través de la Descomposición de Valor Singular de rango completo y restringir las actualizaciones, FuRA supera el ajuste fino completo sin restricciones manteniendo la eficiencia.

27
NEWSTogether AI Blog·18/3/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI ha ampliado su servicio de fine-tuning con soporte nativo para llamadas a herramientas, razonamiento y modelos de visión-lenguaje. Las mejoras también incluyen el entrenamiento de modelos de más de 100 mil millones de parámetros, un rendimiento hasta 6 veces mayor y estimaciones de costos y ETA para los trabajos.

24