Finetuning

8 items

NEWS↑ trendingReddit r/LocalLLaMA·hace 19d

LatitudeGames/Equinox-31B · Hugging Face

LatitudeGames ha lanzado Equinox-31B, un nuevo modelo de IA afinado a partir de Gemma 31B, diseñado para ofrecer una experiencia equilibrada entre aventuras oscuras y narraciones cotidianas. El modelo es versátil y está disponible para su uso en la plataforma AIDungeon, mediante suscripción.

Finetuning AI gaming Gemma AI Model

LatitudeGames/Equinox-31B · Hugging Face

ARTICLE↑ trendingReddit r/LocalLLaMA·15/4/2026

Local AI is the best

El usuario expresa gran satisfacción con la IA local, destacando la libertad de personalización, la ausencia de censura y la garantía de privacidad para discusiones personales. Agradece enormemente a los desarrolladores de modelos de código abierto y herramientas como llama.cpp por hacer posibles estas ventajas.

Finetuning Open Source privacy censorship

RESEARCHarXiv CS.CL·hace 1d

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

La Hipótesis Piggyback explica cómo los tokens de plantilla de chat pueden causar desalineación emergente en LLMs, generalizando el comportamiento ajustado a consultas fuera del dominio. Se propone la técnica Token-Regularized Finetuning (TReFT) para mitigar este problema, preservando el aprendizaje en el dominio y reduciendo la desalineación.

Finetuning Emergent Misalignment LLMs Generalization

RESEARCHarXiv CS.CL·5/5/2026

Model Organisms Are Leaky: Perplexity Differencing Often Reveals Finetuning Objectives

Este artículo propone un método basado en la perplejidad para descubrir los objetivos de ajuste fino en grandes modelos de lenguaje, especialmente en "organismos modelo". El método aprovecha la sobregeneralización de los modelos para identificar sus comportamientos de ajuste fino sin necesidad de suposiciones previas.

Finetuning Perplexity model safety Research Methods

RESEARCHarXiv CS.LG·hace 7d

Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization

Este artículo propone FoLoRA, un marco de optimización que aborda la degradación de capacidades no objetivo durante el ajuste fino de modelos de base. Utiliza un cociente de Rayleigh generalizado para equilibrar la utilidad de la tarea y la penalización de olvido, guiando las actualizaciones para preservar el conocimiento de preentrenamiento.

Finetuning neural networks Optimization machine learning

DOCDEV.to AI·26/4/2026

The Developer's Guide to Finetuning LLMs

El artículo "The Developer's Guide to Finetuning LLMs" ofrece una guía práctica para desarrolladores y líderes minoristas sobre cuándo, por qué y cómo ajustar LLMs. Cubre marcos de decisión, costos, preparación de datos y estrategias de evaluación, comparando el ajuste fino con la ingeniería de prompts y RAG para tareas específicas de marca.

Finetuning prompt-engineering development RAG

RESEARCHarXiv CS.CL·6/5/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda el olvido catastrófico en modelos de lenguaje preentrenados actualizando solo un pequeño subconjunto de filas de memoria. Los experimentos muestran que SMF mejora el rendimiento en una tarea de examen médico y mitiga sustancialmente el olvido en comparación con LoRA y el ajuste fino completo.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting

DOCHugging Face Blog·16/4/2026

Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

Este contenido aborda el entrenamiento y ajuste fino de modelos de embedding y reranker multimodales, utilizando la biblioteca Sentence Transformers para optimizar su rendimiento.

Finetuning embedding models multimodal AI model training