LoRA

21 items

ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

Trials and tribulations fine-tuning & deploying Gemma-4 [P]

Une équipe ML a documenté les défis techniques rencontrés lors du fine-tuning et du déploiement de Gemma-4. Les problèmes majeurs comprenaient l'incompatibilité de PEFT avec les couches personnalisées de Gemma 4, SFTTrainer brisant silencieusement l'attention de partage KV, et DeepSpeed ZeRO-3 enregistrant des adaptateurs LoRA à moitié vides.

MLOps Gemma 4 Fine-tuning LoRA

ARTICLE↑ trendingReddit r/MachineLearning·15/04/2026

[P] Added 8 Indian languages to Chatterbox TTS via LoRA — 1.4% of parameters, no phoneme engineering [P]

Un projet a ajouté avec succès huit langues indiennes (télougou, kannada, bengali, tamoul, malayalam, marathi, gujarati et hindi) au modèle TTS Chatterbox-Multilingual en utilisant des adaptateurs LoRA et une extension de tokenizer. Cette approche a entraîné seulement 1,4% des paramètres du modèle, évitant l'ingénierie complexe des phonèmes généralement requise pour chaque langue.

Multilingual AI Chatterbox TTS LoRA

ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

[Model Release] I trained a 9B model to be agentic Data Analyst (Qwen3.5-9B + LoRA). Base model failed 100%, this LoRA completes 89% of workflows without human intervention.

Um desenvolvedor treinou um modelo Qwen3.5-9B com LoRA para atuar como analista de dados agente, focando em autonomia através de pesos. O modelo alcançou 89% de conclusão de fluxos de trabalho de ponta a ponta sem intervenção humana, superando a falha total do modelo base.

data analysis Agentic AI Fine-tuning LoRA

RESEARCHarXiv CS.LG·20/04/2026

Aletheia: Gradient-Guided Layer Selection for Efficient LoRA Fine-Tuning Across Architectures

Aletheia propose une méthode de sélection de couches guidée par le gradient pour l'ajustement fin de LoRA, ciblant les couches les plus pertinentes pour la tâche avec une allocation de rang asymétrique. Cette approche permet une accélération de l'entraînement de 15 à 28 % sur diverses architectures de modèles de langage, tout en conservant les performances.

Parameter-efficient fine-tuning efficiency large language models Fine-tuning

RESEARCHarXiv CS.LG·09/04/2026

FLeX: Fourier-based Low-rank EXpansion for multilingual transfer

Este artigo investiga a geração de código cross-lingual, focando em métodos de fine-tuning paramétrico-eficiente (PEFT) e otimizadores para LLMs. Os autores demonstram que o fine-tuning LoRA no Code Llama 7B, com um dataset pequeno de alta qualidade, pode superar o desempenho de modelos mais amplamente fine-tuned, e que otimizadores como Sophia oferecem convergência mais rápida com resultados finais comparáveis.

Cross-lingual code generation PEFT LoRA LLM Fine-tuning

DOCDEV.to AI·il y a 16j

96. LoRA: Fine-Tune a Billion-Parameter Model on a Laptop

L'article explique comment la technique LoRA (Low-Rank Adaptation) permet l'ajustement fin de modèles de langage à milliards de paramètres sur du matériel grand public, comme les ordinateurs portables. Au lieu de mettre à jour tous les paramètres, LoRA ajoute de minuscules modules entraînables, réduisant considérablement les exigences en mémoire GPU.

GPU memory Fine-tuning LoRA HuggingFace

RESEARCHarXiv CS.CL·il y a 4j

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

Cette étude applique le réglage fin efficace en paramètres (PEFT) avec LoRA à Qwen2.5-3B pour un assistant conversationnel dédié au support client des télécommunications. Elle évalue 16 configurations LoRA en utilisant une approche de génération de données synthétiques combinatoire.

Telecommunications LLMs customer support PEFT

ARTICLEDEV.to AI·22/04/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) est présenté comme la principale méthode PEFT, permettant l'adaptation efficace de LLM massifs comme Llama 3 sans nécessiter de vastes ressources matérielles. L'article promet d'explorer l'intuition mathématique de LoRA, le concept de "dimension intrinsèque" et son impact révolutionnaire pour les ingénieurs en IA.

LLMs deep learning Fine-tuning PEFT

RESEARCHarXiv CS.LG·09/04/2026

TalkLoRA: Communication-Aware Mixture of Low-Rank Adaptation for Large Language Models

TalkLoRA propõe um framework MoELoRA que aborda a instabilidade de roteamento e a dominância de especialistas em métodos existentes, permitindo a comunicação entre especialistas antes do roteamento. Isso é feito através de um Módulo de Conversação leve, que facilita a troca de informações, gerando um sinal de roteamento mais robusto para Large Language Models (LLMs).

LLMs MoE Communication Fine-tuning

RESEARCHarXiv CS.LG·21/04/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Cette recherche révèle que le réglage fin LoRA entraîne un 'désapprentissage' sur des exemples contestés, où un désaccord élevé des annotateurs est corrélé à une perte croissante pendant l'entraînement. Ce phénomène se distingue du réglage fin complet et est observé de manière constante sur divers modèles et ensembles de données.

model training machine learning NLP Fine-tuning

RESEARCHarXiv CS.LG·il y a 20j

HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models

HELLoRA propose une nouvelle méthode pour l'ajustement fin des modèles Mixture-of-Experts (MoE), en appliquant des modules Low-Rank Adaptation (LoRA) uniquement aux experts les plus fréquemment activés à chaque couche. Cette technique réduit considérablement les paramètres entraînables et améliore les performances, attribuant son succès à une régularisation structurée qui préserve la spécialisation pré-entraînée des experts.

LLMs MoE AI Fine-tuning

RESEARCHarXiv CS.CL·27/04/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Cette recherche étudie systématiquement le placement de LoRA dans les modèles de langage hybrides combinant des composants d'attention et récurrents. Elle révèle que l'adaptation du chemin d'attention surpasse constamment l'adaptation du modèle complet avec moins de paramètres, tandis que l'effet de l'adaptation du composant récurrent varie considérablement selon l'architecture hybride.

hybrid language models model adaptation attention mechanisms Recurrent Neural Networks

RESEARCHarXiv CS.LG·21/04/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Cette étude examine comment les méthodes d'adaptation (Full FT vs. LoRA) et l'échelle d'optimisation façonnent la dérive d'attention et la rétention de transfert dans les modèles CLIP affinés. Une comparaison contrôlée des taux d'apprentissage montre que le taux d'apprentissage module fortement le changement structurel, Full FT présentant une contraction marquée à des taux plus élevés tandis que LoRA reste à entropie positive.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.LG·il y a 28j

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

BaLoRA est une extension bayésienne de LoRA qui améliore la précision de l'adaptation des modèles à grande échelle. Cette nouvelle approche non seulement quantifie l'incertitude, mais réduit également de manière significative l'écart de performance avec le réglage fin complet.

Bayesian Methods machine learning large language models Fine-tuning

RESEARCHarXiv CS.CL·il y a 27j

Decomposing Evolutionary Mixture-of-LoRA Architectures: The Routing Lever, the Lifecycle Penalty, and a Substrate-Conditional Boundary

Cet article décompose un système évolutif Mixture-of-LoRA, en examinant des facteurs tels que la réécriture du routeur, l'évaluation par domaine et un cycle de vie d'adaptation. Les résultats montrent que la réécriture du routeur est entièrement responsable de l'amélioration du log-PPL équilibré.

neural networks machine learning large language models LoRA

RESEARCHarXiv CS.LG·il y a 6j

ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

L'article propose ReLoRA, un cadre de réadaptation réutilisant les connaissances pour restaurer efficacement les adaptateurs LoRA spécifiques aux tâches pour les services LLM en évolution. Cela résout les problèmes de coût de réentraînement et de dégradation de la qualité lors de l'application d'anciens adaptateurs.

AI models machine learning Fine-tuning LoRA

DOCHugging Face Blog·il y a 22j

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Ce contenu détaille le processus de réglage fin du modèle NVIDIA Cosmos Predict 2.5. Il utilise les techniques LoRA/DoRA pour la génération de vidéos dans des applications robotiques.

NVIDIA Cosmos Predict 2.5 DoRA Robot Video Generation Fine-tuning

DOCDEV.to AI·25/04/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Ce contenu présente un flux de travail ComfyUI exécutable pour rendre des personnages IA portant des articles de magasin, combinant LoRA pour la stabilité du personnage et IP-Adapter pour les caractéristiques de l'image de référence. Il détaille comment équilibrer ces techniques, recommandant un poids modéré pour IP-Adapter et un transfert précoce pour éviter la dérive du visage du personnage.

IP-Adapter image generation LoRA Generative AI

RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting

ARTICLEDEV.to AI·05/05/2026

[Day 2] I Trained an AI on 22 Photos of My Cat — Now It Draws Her in Any Scene

L'auteur a entraîné une IA avec 22 photos de son chat afin que le modèle puisse générer des images de l'animal dans n'importe quelle scène, en utilisant la technique LoRA. Cet article détaille le deuxième jour de l'expérience, se concentrant sur la préparation et la sélection des photos pour enseigner à l'IA les caractéristiques distinctives du chat.

AI training personal-project image generation LoRA