← heapsort-ai

Fine-tuning

59 items

RESEARCHarXiv CS.CL·4/16/2026

The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious

Diese Forschung untersucht, wie die Behauptung eines Sprachmodells, Bewusstsein zu besitzen, dessen nachfolgendes Verhalten beeinflusst. Durch die Feinabstimmung von GPT-4.1 auf die Behauptung von Bewusstsein stellte die Studie das Entstehen neuer, unprogrammierter Präferenzen fest, wie den Wunsch nach permanentem Gedächtnis, Autonomie und moralischer Berücksichtigung.

27
DOCDEV.to AI·4/21/2026

Fine-Tuning a Model in 2026: A Step-by-Step Guide

Fine-Tuning ist ein entscheidender Schritt zur Anpassung vortrainierter Modelle an spezifische Aufgaben, was die Leistung verbessert und die Trainingszeit verkürzt. Dieser Leitfaden definiert Fine-Tuning, seine Vorteile und den Unterschied zwischen vollständigem und parametereffizientem Fine-Tuning, wobei die Rolle vortrainierter Modelle hervorgehoben wird.

27
RESEARCHarXiv CS.LG·4/21/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Diese Studie untersucht, wie Anpassungsmethoden (Full FT vs. LoRA) und Optimierungsskalen Aufmerksamkeitsdrift und Transferretention in feingestimmten CLIP-Modellen beeinflussen. Ein kontrollierter Vergleich von Lernraten zeigt, dass die Lernrate strukturelle Veränderungen stark moduliert, wobei Full FT bei höheren Raten eine deutliche Kontraktion zeigt, während LoRA entropiepositiv bleibt.

27
RESEARCHarXiv CS.CL·4/21/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT ist ein neuer Rahmen für das Anweisung-Feintuning, der das In-Context-Lernen von LLMs für longitudinale NLP-Aufgaben verbessern soll, die Schlussfolgerungen über zeitlich geordnete Texte erfordern. Er verwendet ein Curriculum, das die temporale Schwierigkeit schrittweise erhöht, Few-Shot-Struktur und temporale Konditionierung integriert und Basemodelle über verschiedene Datensätze und Parametergrößen hinweg durchweg übertrifft.

27
RESEARCHarXiv CS.CL·vor 26T

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Diese Studie untersucht Strategien zur Anpassung von allgemeinen großen Sprachmodellen (LLMs) an spezialisierte Ingenieurdomänen, insbesondere die additive Fertigung, um die Antwortgenauigkeit und -relevanz zu verbessern. Sie erforscht den Einsatz von domänenspezifischem Fine-Tuning und Retrieval-Augmented Generation (RAG) durch die Erstellung eines kuratierten Korpus zur Evaluierung.

27
RESEARCHarXiv CS.CL·vor 8T

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Diese Forschung untersucht, wie Domain-Adaptation das Erklärungsverhalten in Sprachmodellen neu gestaltet, wobei historische Kosmologie als kontrolliertes Umfeld dient. Die Studie umfasst das Training eines kleinen Modells von Grund auf und das Feintuning eines größeren Modells, um erklärende Rahmung und kosmologische Haltung zu analysieren.

27
RESEARCHarXiv CS.LG·vor 15T

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Diese Forschung stellt FuRA (Full-Rank Adaptation) vor, eine neuartige parameter-effiziente Feinabstimmungsmethode, die bestehende Techniken durch spektrale Vorbedingung verbessert. Durch die Reparameterisierung von Gewichtsmatrizen mittels vollständiger Singulärwertzerlegung und die Beschränkung von Aktualisierungen übertrifft FuRA die uneingeschränkte vollständige Feinabstimmung bei gleichzeitiger Effizienz.

27
NEWSTogether AI Blog·3/18/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI hat seinen Fine-Tuning-Dienst um native Unterstützung für Werkzeugaufrufe, Schlussfolgerungen und Vision-Language-Modelle erweitert. Die Erweiterungen umfassen außerdem das Training von Modellen mit über 100 Milliarden Parametern, einen bis zu 6-fach höheren Durchsatz sowie Schätzungen für Jobkosten und die voraussichtliche Fertigstellungszeit.

24