← heapsort-ai

Finetuning

8 items

NEWS↑ trendingReddit r/LocalLLaMA·hace 19d

LatitudeGames/Equinox-31B · Hugging Face

LatitudeGames ha lanzado Equinox-31B, un nuevo modelo de IA afinado a partir de Gemma 31B, diseñado para ofrecer una experiencia equilibrada entre aventuras oscuras y narraciones cotidianas. El modelo es versátil y está disponible para su uso en la plataforma AIDungeon, mediante suscripción.

LatitudeGames/Equinox-31B · Hugging Face
47
ARTICLE↑ trendingReddit r/LocalLLaMA·15/4/2026

Local AI is the best

El usuario expresa gran satisfacción con la IA local, destacando la libertad de personalización, la ausencia de censura y la garantía de privacidad para discusiones personales. Agradece enormemente a los desarrolladores de modelos de código abierto y herramientas como llama.cpp por hacer posibles estas ventajas.

Local AI is the best
39
RESEARCHarXiv CS.CL·hace 1d

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

La Hipótesis Piggyback explica cómo los tokens de plantilla de chat pueden causar desalineación emergente en LLMs, generalizando el comportamiento ajustado a consultas fuera del dominio. Se propone la técnica Token-Regularized Finetuning (TReFT) para mitigar este problema, preservando el aprendizaje en el dominio y reduciendo la desalineación.

38
RESEARCHarXiv CS.LG·hace 7d

Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization

Este artículo propone FoLoRA, un marco de optimización que aborda la degradación de capacidades no objetivo durante el ajuste fino de modelos de base. Utiliza un cociente de Rayleigh generalizado para equilibrar la utilidad de la tarea y la penalización de olvido, guiando las actualizaciones para preservar el conocimiento de preentrenamiento.

27
DOCDEV.to AI·26/4/2026

The Developer's Guide to Finetuning LLMs

El artículo "The Developer's Guide to Finetuning LLMs" ofrece una guía práctica para desarrolladores y líderes minoristas sobre cuándo, por qué y cómo ajustar LLMs. Cubre marcos de decisión, costos, preparación de datos y estrategias de evaluación, comparando el ajuste fino con la ingeniería de prompts y RAG para tareas específicas de marca.

27
RESEARCHarXiv CS.CL·6/5/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda el olvido catastrófico en modelos de lenguaje preentrenados actualizando solo un pequeño subconjunto de filas de memoria. Los experimentos muestran que SMF mejora el rendimiento en una tarea de examen médico y mitiga sustancialmente el olvido en comparación con LoRA y el ajuste fino completo.

27