← heapsort-ai

LoRA

21 items

ARTICLE↑ trendingReddit r/MachineLearning·18/04/2026

Trials and tribulations fine-tuning & deploying Gemma-4 [P]

Une équipe ML a documenté les défis techniques rencontrés lors du fine-tuning et du déploiement de Gemma-4. Les problèmes majeurs comprenaient l'incompatibilité de PEFT avec les couches personnalisées de Gemma 4, SFTTrainer brisant silencieusement l'attention de partage KV, et DeepSpeed ZeRO-3 enregistrant des adaptateurs LoRA à moitié vides.

46
ARTICLE↑ trendingReddit r/MachineLearning·15/04/2026

[P] Added 8 Indian languages to Chatterbox TTS via LoRA — 1.4% of parameters, no phoneme engineering [P]

Un projet a ajouté avec succès huit langues indiennes (télougou, kannada, bengali, tamoul, malayalam, marathi, gujarati et hindi) au modèle TTS Chatterbox-Multilingual en utilisant des adaptateurs LoRA et une extension de tokenizer. Cette approche a entraîné seulement 1,4% des paramètres du modèle, évitant l'ingénierie complexe des phonèmes généralement requise pour chaque langue.

43
ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

[Model Release] I trained a 9B model to be agentic Data Analyst (Qwen3.5-9B + LoRA). Base model failed 100%, this LoRA completes 89% of workflows without human intervention.

Um desenvolvedor treinou um modelo Qwen3.5-9B com LoRA para atuar como analista de dados agente, focando em autonomia através de pesos. O modelo alcançou 89% de conclusão de fluxos de trabalho de ponta a ponta sem intervenção humana, superando a falha total do modelo base.

42
RESEARCHarXiv CS.LG·20/04/2026

Aletheia: Gradient-Guided Layer Selection for Efficient LoRA Fine-Tuning Across Architectures

Aletheia propose une méthode de sélection de couches guidée par le gradient pour l'ajustement fin de LoRA, ciblant les couches les plus pertinentes pour la tâche avec une allocation de rang asymétrique. Cette approche permet une accélération de l'entraînement de 15 à 28 % sur diverses architectures de modèles de langage, tout en conservant les performances.

32
RESEARCHarXiv CS.LG·09/04/2026

FLeX: Fourier-based Low-rank EXpansion for multilingual transfer

Este artigo investiga a geração de código cross-lingual, focando em métodos de fine-tuning paramétrico-eficiente (PEFT) e otimizadores para LLMs. Os autores demonstram que o fine-tuning LoRA no Code Llama 7B, com um dataset pequeno de alta qualidade, pode superar o desempenho de modelos mais amplamente fine-tuned, e que otimizadores como Sophia oferecem convergência mais rápida com resultados finais comparáveis.

30
DOCDEV.to AI·il y a 16j

96. LoRA: Fine-Tune a Billion-Parameter Model on a Laptop

L'article explique comment la technique LoRA (Low-Rank Adaptation) permet l'ajustement fin de modèles de langage à milliards de paramètres sur du matériel grand public, comme les ordinateurs portables. Au lieu de mettre à jour tous les paramètres, LoRA ajoute de minuscules modules entraînables, réduisant considérablement les exigences en mémoire GPU.

28
ARTICLEDEV.to AI·22/04/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) est présenté comme la principale méthode PEFT, permettant l'adaptation efficace de LLM massifs comme Llama 3 sans nécessiter de vastes ressources matérielles. L'article promet d'explorer l'intuition mathématique de LoRA, le concept de "dimension intrinsèque" et son impact révolutionnaire pour les ingénieurs en IA.

27
RESEARCHarXiv CS.LG·09/04/2026

TalkLoRA: Communication-Aware Mixture of Low-Rank Adaptation for Large Language Models

TalkLoRA propõe um framework MoELoRA que aborda a instabilidade de roteamento e a dominância de especialistas em métodos existentes, permitindo a comunicação entre especialistas antes do roteamento. Isso é feito através de um Módulo de Conversação leve, que facilita a troca de informações, gerando um sinal de roteamento mais robusto para Large Language Models (LLMs).

27
RESEARCHarXiv CS.LG·21/04/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Cette recherche révèle que le réglage fin LoRA entraîne un 'désapprentissage' sur des exemples contestés, où un désaccord élevé des annotateurs est corrélé à une perte croissante pendant l'entraînement. Ce phénomène se distingue du réglage fin complet et est observé de manière constante sur divers modèles et ensembles de données.

27
RESEARCHarXiv CS.LG·il y a 20j

HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models

HELLoRA propose une nouvelle méthode pour l'ajustement fin des modèles Mixture-of-Experts (MoE), en appliquant des modules Low-Rank Adaptation (LoRA) uniquement aux experts les plus fréquemment activés à chaque couche. Cette technique réduit considérablement les paramètres entraînables et améliore les performances, attribuant son succès à une régularisation structurée qui préserve la spécialisation pré-entraînée des experts.

27
RESEARCHarXiv CS.CL·27/04/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Cette recherche étudie systématiquement le placement de LoRA dans les modèles de langage hybrides combinant des composants d'attention et récurrents. Elle révèle que l'adaptation du chemin d'attention surpasse constamment l'adaptation du modèle complet avec moins de paramètres, tandis que l'effet de l'adaptation du composant récurrent varie considérablement selon l'architecture hybride.

27
RESEARCHarXiv CS.LG·21/04/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Cette étude examine comment les méthodes d'adaptation (Full FT vs. LoRA) et l'échelle d'optimisation façonnent la dérive d'attention et la rétention de transfert dans les modèles CLIP affinés. Une comparaison contrôlée des taux d'apprentissage montre que le taux d'apprentissage module fortement le changement structurel, Full FT présentant une contraction marquée à des taux plus élevés tandis que LoRA reste à entropie positive.

27
RESEARCHarXiv CS.CL·il y a 27j

Decomposing Evolutionary Mixture-of-LoRA Architectures: The Routing Lever, the Lifecycle Penalty, and a Substrate-Conditional Boundary

Cet article décompose un système évolutif Mixture-of-LoRA, en examinant des facteurs tels que la réécriture du routeur, l'évaluation par domaine et un cycle de vie d'adaptation. Les résultats montrent que la réécriture du routeur est entièrement responsable de l'amélioration du log-PPL équilibré.

27
DOCDEV.to AI·25/04/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Ce contenu présente un flux de travail ComfyUI exécutable pour rendre des personnages IA portant des articles de magasin, combinant LoRA pour la stabilité du personnage et IP-Adapter pour les caractéristiques de l'image de référence. Il détaille comment équilibrer ces techniques, recommandant un poids modéré pour IP-Adapter et un transfert précoce pour éviter la dérive du visage du personnage.

27
RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

27
ARTICLEDEV.to AI·05/05/2026

[Day 2] I Trained an AI on 22 Photos of My Cat — Now It Draws Her in Any Scene

L'auteur a entraîné une IA avec 22 photos de son chat afin que le modèle puisse générer des images de l'animal dans n'importe quelle scène, en utilisant la technique LoRA. Cet article détaille le deuxième jour de l'expérience, se concentrant sur la préparation et la sélection des photos pour enseigner à l'IA les caractéristiques distinctives du chat.

24