LoRA

21 items

ARTICLE↑ trendingReddit r/MachineLearning·4/18/2026

Trials and tribulations fine-tuning & deploying Gemma-4 [P]

Ein ML-Team dokumentierte die technischen Herausforderungen beim Fine-Tuning und der Bereitstellung von Gemma-4. Schlüsselprobleme waren die Inkompatibilität von PEFT mit Gemma 4s benutzerdefinierten Layern, das stille Unterbrechen der KV-Sharing-Attention durch SFTTrainer sowie DeepSpeed ZeRO-3, das halb-leere LoRA-Adapter speicherte.

MLOps Gemma 4 Fine-tuning LoRA

ARTICLE↑ trendingReddit r/MachineLearning·4/15/2026

[P] Added 8 Indian languages to Chatterbox TTS via LoRA — 1.4% of parameters, no phoneme engineering [P]

Ein Projekt hat erfolgreich acht indische Sprachen (Telugu, Kannada, Bengali, Tamil, Malayalam, Marathi, Gujarati und Hindi) zum Chatterbox-Multilingual-TTS-Modell hinzugefügt, indem es LoRA-Adapter und Tokenizer-Erweiterung nutzte. Dieser Ansatz trainierte nur 1,4 % der Modellparameter und vermied so das komplexe Phonem-Engineering, das normalerweise für jede Sprache erforderlich ist.

Multilingual AI Chatterbox TTS LoRA

ARTICLE↑ trendingReddit r/LocalLLaMA·4/10/2026

[Model Release] I trained a 9B model to be agentic Data Analyst (Qwen3.5-9B + LoRA). Base model failed 100%, this LoRA completes 89% of workflows without human intervention.

Um desenvolvedor treinou um modelo Qwen3.5-9B com LoRA para atuar como analista de dados agente, focando em autonomia através de pesos. O modelo alcançou 89% de conclusão de fluxos de trabalho de ponta a ponta sem intervenção humana, superando a falha total do modelo base.

Data Analysis Agentic AI Fine-tuning LoRA

RESEARCHarXiv CS.LG·4/20/2026

Aletheia: Gradient-Guided Layer Selection for Efficient LoRA Fine-Tuning Across Architectures

Aletheia führt eine gradientengesteuerte Schichtauswahlmethode für das LoRA-Feintuning ein, die aufgabenrelevante Schichten identifiziert und Adapter asymmetrisch zuweist. Diese Methode erreicht eine Trainingsbeschleunigung von 15-28% über verschiedene große Sprachmodelle und Architekturen hinweg, bei weitgehend gleichbleibender Downstream-Leistung.

Parameter-efficient fine-tuning efficiency large language models Fine-tuning

RESEARCHarXiv CS.LG·4/9/2026

FLeX: Fourier-based Low-rank EXpansion for multilingual transfer

Este artigo investiga a geração de código cross-lingual, focando em métodos de fine-tuning paramétrico-eficiente (PEFT) e otimizadores para LLMs. Os autores demonstram que o fine-tuning LoRA no Code Llama 7B, com um dataset pequeno de alta qualidade, pode superar o desempenho de modelos mais amplamente fine-tuned, e que otimizadores como Sophia oferecem convergência mais rápida com resultados finais comparáveis.

Cross-lingual code generation PEFT LoRA LLM Fine-tuning

RESEARCHarXiv CS.CL·vor 4T

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

Diese Studie untersucht Parameter-Efficient Fine-Tuning (PEFT) mittels LoRA auf Qwen2.5-3B für einen Konversationsassistenten im Telekommunikations-Kundensupport. Es werden 16 LoRA-Konfigurationen basierend auf synthetischen Daten evaluiert, die 30.000 Trainingsbeispiele umfassen.

Telecommunications LLMs customer support PEFT

DOCDEV.to AI·vor 16T

96. LoRA: Fine-Tune a Billion-Parameter Model on a Laptop

Der Artikel erklärt, wie die LoRA-Technik (Low-Rank Adaptation) das Fine-Tuning von Sprachmodellen mit Milliarden von Parametern auf Consumer-Hardware wie Laptops ermöglicht. Anstatt alle Parameter zu aktualisieren, fügt LoRA winzige trainierbare Module hinzu, was den GPU-Speicherbedarf drastisch reduziert.

GPU memory Fine-tuning LoRA HuggingFace

ARTICLEDEV.to AI·4/22/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) wird als die führende PEFT-Methode vorgestellt, die die effiziente Anpassung riesiger LLMs wie Llama 3 ohne umfangreiche Hardware-Ressourcen ermöglicht. Der Beitrag verspricht, die mathematische Intuition von LoRA, das Konzept der "intrinsischen Dimension" und seine transformative Bedeutung für KI-Ingenieure zu beleuchten.

LLMs deep learning Fine-tuning PEFT

RESEARCHarXiv CS.LG·4/9/2026

TalkLoRA: Communication-Aware Mixture of Low-Rank Adaptation for Large Language Models

TalkLoRA propõe um framework MoELoRA que aborda a instabilidade de roteamento e a dominância de especialistas em métodos existentes, permitindo a comunicação entre especialistas antes do roteamento. Isso é feito através de um Módulo de Conversação leve, que facilita a troca de informações, gerando um sinal de roteamento mais robusto para Large Language Models (LLMs).

LLMs MoE Communication Fine-tuning

RESEARCHarXiv CS.LG·4/21/2026

Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning

Diese Forschung zeigt, dass LoRA-Fine-Tuning bei umstrittenen Beispielen ein „Entlernen“ bewirkt, wobei eine hohe AnnotatorenUneinigkeit mit einem Anstieg des Verlusts während des Trainings korreliert. Dieses Muster unterscheidet sich vom vollständigen Fine-Tuning und wird konsistent über mehrere Modelle und Datensätze hinweg beobachtet.

model training machine learning NLP Fine-tuning

RESEARCHarXiv CS.LG·vor 6T

ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

Dieser Artikel stellt ReLoRA vor, ein wissenswiederverwendendes Re-Adaptions-Framework, das LoRA-Adapter für sich entwickelnde LLM-Dienste effizient wiederherstellt. Es adressiert die hohen Kosten des Neu-Trainings und die Qualitätsminderung bei der naiven Anwendung auf aktualisierte Basismodelle.

AI models machine learning Fine-tuning LoRA

RESEARCHarXiv CS.LG·vor 20T

HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models

HELLoRA schlägt eine neue Methode zur Feinabstimmung von Mixture-of-Experts (MoE)-Modellen vor, indem Low-Rank Adaptation (LoRA)-Module nur an den am häufigsten aktivierten Experten jeder Schicht angebracht werden. Diese Technik reduziert die trainierbaren Parameter erheblich und verbessert die Leistung, was auf eine strukturierte Regularisierung zurückzuführen ist, die die vortrainierte Expertenspezialisierung bewahrt.

LLMs MoE AI Fine-tuning

RESEARCHarXiv CS.CL·4/27/2026

Where Should LoRA Go? Component-Type Placement in Hybrid Language Models

Diese Forschung untersucht systematisch die Platzierung von LoRA in hybriden Sprachmodellen, die Aufmerksamkeits- und rekursive Komponenten kombinieren. Es wird festgestellt, dass die Anpassung des Aufmerksamkeits-Pfades die vollständige Modelladaption konsistent übertrifft und dabei erheblich weniger trainierbare Parameter benötigt, wobei die Anpassung des rekurrenten Rückgrats je nach Hybridarchitektur drastisch unterschiedlich wirkt.

hybrid language models model adaptation attention mechanisms Recurrent Neural Networks

RESEARCHarXiv CS.LG·4/21/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Diese Studie untersucht, wie Anpassungsmethoden (Full FT vs. LoRA) und Optimierungsskalen Aufmerksamkeitsdrift und Transferretention in feingestimmten CLIP-Modellen beeinflussen. Ein kontrollierter Vergleich von Lernraten zeigt, dass die Lernrate strukturelle Veränderungen stark moduliert, wobei Full FT bei höheren Raten eine deutliche Kontraktion zeigt, während LoRA entropiepositiv bleibt.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.LG·vor 28T

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

BaLoRA ist eine Bayes'sche Erweiterung von LoRA, die die Genauigkeit der Anpassung großer Modelle verbessert. Dieser innovative Ansatz quantifiziert nicht nur die Unsicherheit, sondern verringert auch signifikant den Leistungsunterschied zum vollständigen Fine-Tuning.

Bayesian Methods machine learning large language models Fine-tuning

RESEARCHarXiv CS.CL·vor 27T

Decomposing Evolutionary Mixture-of-LoRA Architectures: The Routing Lever, the Lifecycle Penalty, and a Substrate-Conditional Boundary

Diese Arbeit zerlegt ein evolutionäres Mixture-of-LoRA-System und untersucht Faktoren wie die Neuschreibung des Routers, die domänenweise Bewertung und einen Adaptationslebenszyklus. Die Ergebnisse zeigen, dass die Neuschreibung des Routers allein für die beobachtete Verbesserung des ausgewogenen Log-PPL verantwortlich ist.

neural networks machine learning large language models LoRA

DOCHugging Face Blog·vor 22T

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Dieser Inhalt beschreibt den Feinabstimmungsprozess des NVIDIA Cosmos Predict 2.5 Modells. Er nutzt LoRA/DoRA-Techniken für die Videogenerierung in Roboteranwendungen.

NVIDIA Cosmos Predict 2.5 DoRA Robot Video Generation Fine-tuning

DOCDEV.to AI·4/25/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Dieser Inhalt stellt einen ausführbaren ComfyUI-Workflow zum Rendern von KI-Charakteren mit Ladenartikeln vor, der LoRA für Charakterstabilität und IP-Adapter für Referenzbildmerkmale kombiniert. Er erklärt, wie diese Techniken auszubalancieren sind, und empfiehlt ein moderates IP-Adapter-Gewicht und eine frühe Übergabe, um eine Gesichtsverformung zu vermeiden.

IP-Adapter image generation LoRA Generative AI

RESEARCHarXiv CS.CL·5/6/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) begegnet dem katastrophalen Vergessen in vortrainierten Sprachmodellen, indem nur eine kleine Untermenge von Speicherzeilen aktualisiert wird. Experimente zeigen, dass SMF die Leistung bei einer medizinischen Prüfungsaufgabe verbessert und gleichzeitig das Vergessen im Vergleich zu LoRA und vollständigem Finetuning erheblich reduziert.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting

ARTICLEDEV.to AI·5/5/2026

[Day 2] I Trained an AI on 22 Photos of My Cat — Now It Draws Her in Any Scene

Der Autor trainierte eine KI mit 22 Fotos seiner Katze, damit das Modell Bilder des Tieres in beliebigen Szenen generieren kann, unter Verwendung der LoRA-Technik. Dieser Artikel beschreibt den zweiten Tag des Experiments, wobei der Fokus auf der Vorbereitung und Auswahl der Fotos liegt, um der KI die charakteristischen Merkmale der Katze beizubringen.

AI training personal-project image generation LoRA