← heapsort-ai

Fine-tuning

59 items

DOCDEV.to AI·21/04/2026

Fine-Tuning a Model in 2026: A Step-by-Step Guide

Le réglage fin est une étape essentielle pour adapter les modèles pré-entraînés à des tâches spécifiques, améliorant les performances et réduisant le temps d'entraînement. Ce guide définit le réglage fin, ses avantages et la distinction entre le réglage fin complet et le réglage fin économe en paramètres, soulignant le rôle des modèles pré-entraînés.

27
RESEARCHarXiv CS.LG·21/04/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Cette étude examine comment les méthodes d'adaptation (Full FT vs. LoRA) et l'échelle d'optimisation façonnent la dérive d'attention et la rétention de transfert dans les modèles CLIP affinés. Une comparaison contrôlée des taux d'apprentissage montre que le taux d'apprentissage module fortement le changement structurel, Full FT présentant une contraction marquée à des taux plus élevés tandis que LoRA reste à entropie positive.

27
RESEARCHarXiv CS.CL·21/04/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT est un nouveau cadre de réglage fin par instruction visant à améliorer l'apprentissage en contexte des LLM pour les tâches PNL longitudinales, qui nécessitent un raisonnement sur des textes ordonnés temporellement. Il utilise un curriculum augmentant progressivement la difficulté temporelle, intégrant une structure d'apprentissage par quelques exemples et un conditionnement temporel, surpassant constamment les modèles de base sur divers ensembles de données et tailles de paramètres.

27
RESEARCHarXiv CS.LG·il y a 27j

Rotation-Preserving Supervised Fine-Tuning

Cet article présente le "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) pour améliorer la généralisation hors domaine dans les grands modèles linguistiques. Il pénalise les changements dans les sous-espaces singuliers pré-entraînés, agissant comme un proxy efficace pour les directions sensibles à Fisher et surpassant les bases SFT standards.

27
RESEARCHarXiv CS.CL·il y a 26j

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Cette étude explore des stratégies pour adapter les grands modèles linguistiques (LLM) à usage général aux domaines d'ingénierie spécialisés, notamment la fabrication additive, afin d'améliorer la précision et la pertinence des réponses. Elle examine l'utilisation de l'ajustement fin spécifique au domaine et de la génération augmentée par récupération (RAG) en construisant un corpus sélectionné pour évaluation.

27
RESEARCHarXiv CS.CL·il y a 8j

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Cette recherche étudie comment l'adaptation de domaine remodèle le comportement explicatif des modèles de langage, en utilisant la cosmologie historique comme cadre contrôlé. L'étude implique l'entraînement d'un petit modèle à partir de zéro et le réglage fin d'un modèle plus grand pour analyser le cadrage explicatif et la position cosmologique.

27
RESEARCHarXiv CS.LG·il y a 15j

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Cette recherche introduit FuRA (Full-Rank Adaptation), une nouvelle méthode de réglage fin efficace en paramètres qui aborde les limites des techniques existantes en incorporant un préconditionnement spectral. En reparamétrant les matrices de poids via la décomposition en valeurs singulières de rang complet et en limitant les mises à jour, FuRA surpasse le réglage fin complet non contraint tout en maintenant l'efficacité.

27
NEWSTogether AI Blog·18/03/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI a étendu son service de fine-tuning avec un support natif pour l'appel d'outils, le raisonnement et les modèles de vision-langage. Les améliorations comprennent également la formation de modèles de plus de 100 milliards de paramètres, un débit jusqu'à 6 fois supérieur, et des estimations de coût et de délai.

24