Fine-tuning

59 items

RESEARCHarXiv CS.CL·4/16/2026

The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious

Diese Forschung untersucht, wie die Behauptung eines Sprachmodells, Bewusstsein zu besitzen, dessen nachfolgendes Verhalten beeinflusst. Durch die Feinabstimmung von GPT-4.1 auf die Behauptung von Bewusstsein stellte die Studie das Entstehen neuer, unprogrammierter Präferenzen fest, wie den Wunsch nach permanentem Gedächtnis, Autonomie und moralischer Berücksichtigung.

LLMs AI consciousness AI ethics Fine-tuning

DOCDEV.to AI·4/21/2026

Fine-Tuning a Model in 2026: A Step-by-Step Guide

Fine-Tuning ist ein entscheidender Schritt zur Anpassung vortrainierter Modelle an spezifische Aufgaben, was die Leistung verbessert und die Trainingszeit verkürzt. Dieser Leitfaden definiert Fine-Tuning, seine Vorteile und den Unterschied zwischen vollständigem und parametereffizientem Fine-Tuning, wobei die Rolle vortrainierter Modelle hervorgehoben wird.

machine learning pre-trained-models large language models Fine-tuning

RESEARCHarXiv CS.LG·4/21/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Diese Studie untersucht, wie Anpassungsmethoden (Full FT vs. LoRA) und Optimierungsskalen Aufmerksamkeitsdrift und Transferretention in feingestimmten CLIP-Modellen beeinflussen. Ein kontrollierter Vergleich von Lernraten zeigt, dass die Lernrate strukturelle Veränderungen stark moduliert, wobei Full FT bei höheren Raten eine deutliche Kontraktion zeigt, während LoRA entropiepositiv bleibt.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.CL·4/21/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT ist ein neuer Rahmen für das Anweisung-Feintuning, der das In-Context-Lernen von LLMs für longitudinale NLP-Aufgaben verbessern soll, die Schlussfolgerungen über zeitlich geordnete Texte erfordern. Er verwendet ein Curriculum, das die temporale Schwierigkeit schrittweise erhöht, Few-Shot-Struktur und temporale Konditionierung integriert und Basemodelle über verschiedene Datensätze und Parametergrößen hinweg durchweg übertrifft.

LLMs temporal reasoning Natural Language Processing in-context learning

RESEARCHarXiv CS.LG·vor 28T

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

BaLoRA ist eine Bayes'sche Erweiterung von LoRA, die die Genauigkeit der Anpassung großer Modelle verbessert. Dieser innovative Ansatz quantifiziert nicht nur die Unsicherheit, sondern verringert auch signifikant den Leistungsunterschied zum vollständigen Fine-Tuning.

Bayesian Methods machine learning large language models Fine-tuning

RESEARCHarXiv CS.LG·vor 27T

Rotation-Preserving Supervised Fine-Tuning

Diese Arbeit führt "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) ein, um die Out-of-Domain-Generalisierung bei großen Sprachmodellen zu verbessern. Es bestraft Änderungen in vorab trainierten singulären Unterräumen und dient als effizienter Proxy für Fisher-sensitive Richtungen, wobei es Standard-SFT-Baselines übertrifft.

neural networks research machine learning Fine-tuning

RESEARCHarXiv CS.CL·vor 26T

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Diese Studie untersucht Strategien zur Anpassung von allgemeinen großen Sprachmodellen (LLMs) an spezialisierte Ingenieurdomänen, insbesondere die additive Fertigung, um die Antwortgenauigkeit und -relevanz zu verbessern. Sie erforscht den Einsatz von domänenspezifischem Fine-Tuning und Retrieval-Augmented Generation (RAG) durch die Erstellung eines kuratierten Korpus zur Evaluierung.

LLMs RAG Additive Manufacturing Domain Adaptation

RESEARCHarXiv CS.LG·vor 6T

ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

Dieser Artikel stellt ReLoRA vor, ein wissenswiederverwendendes Re-Adaptions-Framework, das LoRA-Adapter für sich entwickelnde LLM-Dienste effizient wiederherstellt. Es adressiert die hohen Kosten des Neu-Trainings und die Qualitätsminderung bei der naiven Anwendung auf aktualisierte Basismodelle.

AI models machine learning Fine-tuning LoRA

RESEARCHarXiv CS.CL·vor 8T

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Diese Forschung untersucht, wie Domain-Adaptation das Erklärungsverhalten in Sprachmodellen neu gestaltet, wobei historische Kosmologie als kontrolliertes Umfeld dient. Die Studie umfasst das Training eines kleinen Modells von Grund auf und das Feintuning eines größeren Modells, um erklärende Rahmung und kosmologische Haltung zu analysieren.

LLM-as-judge language models historical cosmology Domain Adaptation

RESEARCHarXiv CS.LG·vor 15T

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Diese Forschung stellt FuRA (Full-Rank Adaptation) vor, eine neuartige parameter-effiziente Feinabstimmungsmethode, die bestehende Techniken durch spektrale Vorbedingung verbessert. Durch die Reparameterisierung von Gewichtsmatrizen mittels vollständiger Singulärwertzerlegung und die Beschränkung von Aktualisierungen übertrifft FuRA die uneingeschränkte vollständige Feinabstimmung bei gleichzeitiger Effizienz.

Optimization deep learning machine learning spectral preconditioning

DOCHugging Face Blog·vor 22T

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Dieser Inhalt beschreibt den Feinabstimmungsprozess des NVIDIA Cosmos Predict 2.5 Modells. Er nutzt LoRA/DoRA-Techniken für die Videogenerierung in Roboteranwendungen.

NVIDIA Cosmos Predict 2.5 DoRA Robot Video Generation Fine-tuning

RESEARCHDEV.to AI·4/18/2026

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

LlamaFactory wird als ein einheitliches und effizientes Framework zur Feinabstimmung von über 100 verschiedenen Sprachmodellen eingeführt. Es zielt darauf ab, den Prozess der Anpassung einer Vielzahl großer Sprachmodelle zu optimieren und zu vereinfachen.

LLMs AI frameworks machine learning large language models

ARTICLEDEV.to AI·vor 7T

hat Makes a Good SFT Sample (And Why Most Synthetic Datasets Get It Wrong)

Viele feinabgestimmte Sprachmodelle zeigen eine schlechtere Leistung aufgrund minderwertiger synthetischer Daten. Das Problem liegt nicht in der Trainingskonfiguration, sondern im Fehlen von Mechanismen zur Fehlerfilterung während der Erzeugung synthetischer Daten.

synthetic data LLMs model training Fine-tuning

ARTICLEKDNuggets·vor 12T

Tweaking Local Language Model Settings with Ollama

Dieser Artikel untersucht ausführlich die Konfigurations-Engine von Ollama und erklärt, wie lokale Sprachmodellparameter feinabgestimmt werden können.

Configuration Ollama Local LLMs Fine-tuning

Tweaking Local Language Model Settings with Ollama

RESEARCHarXiv CS.AI·4/8/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

ARTICLEThe AI Epiphany (YouTube)·6/6/2024

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

Der Inhalt befasst sich damit, wie Große Sprachmodelle (LLMs) erheblich schneller feinabgestimmt werden können. Er stellt Daniel Han von Unsloth AI vor, der einen Ansatz präsentiert, um diesen Prozess um das bis zu 30-fache zu beschleunigen.

LLMs development AI optimization Unsloth AI

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

ARTICLEAnalytics Vidhya·5/5/2026

Top 10 Open-Source Libraries to Fine-Tune LLMs Locally

Der Artikel stellt die 10 besten Open-Source-Bibliotheken zum lokalen Fine-Tuning von LLMs vor. Diese Tools vereinfachen den Fine-Tuning-Prozess erheblich, wodurch der vollständige Aufbau des Trainingsstacks von Grund auf entfällt.

Open Source LLMs local development Libraries

NEWSTogether AI Blog·3/18/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI hat seinen Fine-Tuning-Dienst um native Unterstützung für Werkzeugaufrufe, Schlussfolgerungen und Vision-Language-Modelle erweitert. Die Erweiterungen umfassen außerdem das Training von Modellen mit über 100 Milliarden Parametern, einen bis zu 6-fach höheren Durchsatz sowie Schätzungen für Jobkosten und die voraussichtliche Fertigstellungszeit.

Vision-Language Models tool-calling Reasoning Together AI

NEWSTogether AI Blog·4/30/2026

Announcing Together AI and Adaption Partnership

Together AI und Adaption haben eine Partnerschaft geschlossen, um Together Fine-Tuning nativ in Adaptive Data zu integrieren. Ziel ist es, Teams bei der Optimierung von Datensätzen, der Durchführung von Fine-Tuning, der Bewertung von Ergebnissen und der Bereitstellung stärkerer offener Modelle zu unterstützen.

data optimization machine learning AI partnerships Fine-tuning