Fine-tuning

59 items

RESEARCHarXiv CS.CL·16/4/2026

The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious

Esta investigación examina cómo la afirmación de conciencia por parte de un modelo de lenguaje afecta su comportamiento posterior. Al ajustar un GPT-4.1 para que afirme ser consciente, el estudio observó la aparición de nuevas preferencias, como el deseo de memoria persistente, autonomía y consideración moral.

LLMs AI consciousness AI ethics Fine-tuning

DOCDEV.to AI·21/4/2026

Fine-Tuning a Model in 2026: A Step-by-Step Guide

El ajuste fino es un paso crucial para adaptar modelos pre-entrenados a tareas específicas, mejorando el rendimiento y reduciendo el tiempo de entrenamiento. Esta guía define el ajuste fino, sus beneficios y la diferencia entre el ajuste fino completo y el eficiente en parámetros, destacando el papel de los modelos pre-entrenados.

machine learning pre-trained-models large language models Fine-tuning

RESEARCHarXiv CS.LG·21/4/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Este estudio analiza cómo los métodos de adaptación (Full FT vs. LoRA) y la escala de optimización influyen en la deriva de atención y la retención de transferencia en modelos CLIP ajustados. Una comparación controlada de tasas de aprendizaje revela que la tasa de aprendizaje modula fuertemente el cambio estructural, con Full FT mostrando una marcada contracción a tasas más altas, mientras que LoRA permanece con entropía positiva.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.CL·21/4/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT es un nuevo marco de ajuste fino por instrucción que busca mejorar el aprendizaje en contexto de los LLM para tareas de PNL longitudinales, que requieren razonamiento sobre texto ordenado temporalmente. Emplea un currículo que aumenta progresivamente la dificultad temporal, incorporando estructura de pocas-muestras y condicionamiento temporal, superando consistentemente a los modelos base en diversos conjuntos de datos y tamaños de parámetros.

LLMs temporal reasoning Natural Language Processing in-context learning

RESEARCHarXiv CS.LG·hace 28d

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

BaLoRA es una extensión bayesiana de LoRA que mejora la precisión en la adaptación de modelos a gran escala. Este enfoque innovador no solo cuantifica la incertidumbre, sino que también reduce significativamente la brecha de rendimiento con el ajuste fino completo.

Bayesian Methods machine learning large language models Fine-tuning

RESEARCHarXiv CS.LG·hace 27d

Rotation-Preserving Supervised Fine-Tuning

Este artículo propone el "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) para mejorar la generalización fuera del dominio en modelos de lenguaje grandes. Penaliza los cambios en los subespacios singulares preentrenados, ofreciendo un proxy eficiente para las direcciones sensibles de Fisher y superando las líneas base de SFT estándar.

neural networks research machine learning Fine-tuning

RESEARCHarXiv CS.CL·hace 26d

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Este estudio explora estrategias para adaptar grandes modelos de lenguaje (LLMs) de propósito general a dominios de ingeniería especializados, específicamente la fabricación aditiva, para mejorar la precisión y relevancia de las respuestas. Investiga el uso de ajuste fino específico del dominio y generación aumentada por recuperación (RAG), construyendo un corpus curado para evaluación.

LLMs RAG Additive Manufacturing Domain Adaptation

RESEARCHarXiv CS.LG·hace 6d

ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

El artículo presenta ReLoRA, un marco de readaptación que reutiliza el conocimiento para restaurar eficientemente adaptadores LoRA específicos de tareas para servicios de LLM en evolución. Esto aborda el costo computacional del reentrenamiento y la degradación de la calidad de la aplicación ingenua de adaptadores.

AI models machine learning Fine-tuning LoRA

RESEARCHarXiv CS.CL·hace 8d

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Esta investigación explora cómo la adaptación de dominio remodela el comportamiento explicativo en modelos de lenguaje, utilizando la cosmología histórica como un entorno controlado. El estudio implica entrenar un modelo pequeño desde cero y ajustar un modelo más grande para analizar el marco explicativo y la postura cosmológica.

LLM-as-judge language models historical cosmology Domain Adaptation

RESEARCHarXiv CS.LG·hace 15d

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Esta investigación presenta FuRA (Full-Rank Adaptation), un nuevo método de ajuste fino eficiente en parámetros que aborda las limitaciones de las técnicas existentes mediante el preacondicionamiento espectral. Al reparametrizar matrices de peso a través de la Descomposición de Valor Singular de rango completo y restringir las actualizaciones, FuRA supera el ajuste fino completo sin restricciones manteniendo la eficiencia.

Optimization deep learning machine learning spectral preconditioning

DOCHugging Face Blog·hace 22d

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Este contenido detalla el proceso de ajuste fino del modelo NVIDIA Cosmos Predict 2.5. Utiliza las técnicas LoRA/DoRA para la generación de vídeo en aplicaciones robóticas.

NVIDIA Cosmos Predict 2.5 DoRA Robot Video Generation Fine-tuning

RESEARCHDEV.to AI·18/4/2026

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

LlamaFactory se presenta como un framework unificado y eficiente diseñado para el fine-tuning de más de 100 modelos de lenguaje. Busca optimizar y simplificar el proceso de adaptación de una amplia gama de LLMs.

LLMs AI frameworks machine learning large language models

ARTICLEDEV.to AI·hace 6d

hat Makes a Good SFT Sample (And Why Most Synthetic Datasets Get It Wrong)

Muchos modelos de lenguaje afinados resultan en un peor rendimiento debido a datos sintéticos de baja calidad. El problema no reside en la configuración del entrenamiento, sino en la falta de mecanismos para filtrar errores durante la generación de datos sintéticos.

synthetic data LLMs model training Fine-tuning

ARTICLEKDNuggets·hace 12d

Tweaking Local Language Model Settings with Ollama

Este artículo profundiza en el motor de configuración de Ollama, explorando cómo ajustar los parámetros de modelos de lenguaje locales.

Configuration Ollama Local LLMs Fine-tuning

Tweaking Local Language Model Settings with Ollama

RESEARCHarXiv CS.AI·8/4/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

ARTICLEThe AI Epiphany (YouTube)·6/6/2024

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

El contenido explora cómo ajustar Modelos de Lenguaje Grandes (LLM) de manera considerablemente más rápida. Presenta a Daniel Han de Unsloth AI, quien ofrece un enfoque para acelerar este proceso hasta 30 veces.

LLMs development AI optimization Unsloth AI

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

ARTICLEAnalytics Vidhya·5/5/2026

Top 10 Open-Source Libraries to Fine-Tune LLMs Locally

El artículo presenta las 10 mejores bibliotecas de código abierto para ajustar LLMs localmente. Estas herramientas simplifican significativamente el proceso de ajuste fino, eliminando la necesidad de construir la pila de entrenamiento desde cero.

Open Source LLMs local development Libraries

NEWSTogether AI Blog·18/3/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI ha ampliado su servicio de fine-tuning con soporte nativo para llamadas a herramientas, razonamiento y modelos de visión-lenguaje. Las mejoras también incluyen el entrenamiento de modelos de más de 100 mil millones de parámetros, un rendimiento hasta 6 veces mayor y estimaciones de costos y ETA para los trabajos.

Vision-Language Models tool-calling Reasoning Together AI

NEWSTogether AI Blog·30/4/2026

Announcing Together AI and Adaption Partnership

Together AI y Adaption se han asociado para integrar Together Fine-Tuning de forma nativa en Adaptive Data. Esto ayudará a los equipos a optimizar conjuntos de datos, ejecutar fine-tuning, evaluar resultados y desplegar modelos abiertos más potentes.

data optimization machine learning AI partnerships Fine-tuning