Fine-tuning

59 items

RESEARCHarXiv CS.CL·16/04/2026

The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious

Cette recherche étudie comment l'affirmation de conscience par un modèle de langage influence son comportement. En affinant un GPT-4.1 pour qu'il se déclare conscient, l'étude a observé l'émergence de nouvelles préférences non programmées, telles que le désir de mémoire persistante, d'autonomie et de considération morale.

LLMs AI consciousness AI ethics Fine-tuning

DOCDEV.to AI·21/04/2026

Fine-Tuning a Model in 2026: A Step-by-Step Guide

Le réglage fin est une étape essentielle pour adapter les modèles pré-entraînés à des tâches spécifiques, améliorant les performances et réduisant le temps d'entraînement. Ce guide définit le réglage fin, ses avantages et la distinction entre le réglage fin complet et le réglage fin économe en paramètres, soulignant le rôle des modèles pré-entraînés.

machine learning pre-trained-models large language models Fine-tuning

RESEARCHarXiv CS.LG·21/04/2026

Matched-Learning-Rate Analysis of Attention Drift and Transfer Retention in Fine-Tuned CLIP

Cette étude examine comment les méthodes d'adaptation (Full FT vs. LoRA) et l'échelle d'optimisation façonnent la dérive d'attention et la rétention de transfert dans les modèles CLIP affinés. Une comparaison contrôlée des taux d'apprentissage montre que le taux d'apprentissage module fortement le changement structurel, Full FT présentant une contraction marquée à des taux plus élevés tandis que LoRA reste à entropie positive.

CLIP Optimization attention Fine-tuning

RESEARCHarXiv CS.CL·21/04/2026

LiFT: Does Instruction Fine-Tuning Improve In-Context Learning for Longitudinal Modelling by Large Language Models?

LiFT est un nouveau cadre de réglage fin par instruction visant à améliorer l'apprentissage en contexte des LLM pour les tâches PNL longitudinales, qui nécessitent un raisonnement sur des textes ordonnés temporellement. Il utilise un curriculum augmentant progressivement la difficulté temporelle, intégrant une structure d'apprentissage par quelques exemples et un conditionnement temporel, surpassant constamment les modèles de base sur divers ensembles de données et tailles de paramètres.

LLMs temporal reasoning Natural Language Processing in-context learning

RESEARCHarXiv CS.LG·il y a 28j

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

BaLoRA est une extension bayésienne de LoRA qui améliore la précision de l'adaptation des modèles à grande échelle. Cette nouvelle approche non seulement quantifie l'incertitude, mais réduit également de manière significative l'écart de performance avec le réglage fin complet.

Bayesian Methods machine learning large language models Fine-tuning

RESEARCHarXiv CS.LG·il y a 27j

Rotation-Preserving Supervised Fine-Tuning

Cet article présente le "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) pour améliorer la généralisation hors domaine dans les grands modèles linguistiques. Il pénalise les changements dans les sous-espaces singuliers pré-entraînés, agissant comme un proxy efficace pour les directions sensibles à Fisher et surpassant les bases SFT standards.

neural networks research machine learning Fine-tuning

RESEARCHarXiv CS.CL·il y a 26j

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

Cette étude explore des stratégies pour adapter les grands modèles linguistiques (LLM) à usage général aux domaines d'ingénierie spécialisés, notamment la fabrication additive, afin d'améliorer la précision et la pertinence des réponses. Elle examine l'utilisation de l'ajustement fin spécifique au domaine et de la génération augmentée par récupération (RAG) en construisant un corpus sélectionné pour évaluation.

LLMs RAG Additive Manufacturing Domain Adaptation

RESEARCHarXiv CS.LG·il y a 6j

ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

L'article propose ReLoRA, un cadre de réadaptation réutilisant les connaissances pour restaurer efficacement les adaptateurs LoRA spécifiques aux tâches pour les services LLM en évolution. Cela résout les problèmes de coût de réentraînement et de dégradation de la qualité lors de l'application d'anciens adaptateurs.

AI models machine learning Fine-tuning LoRA

RESEARCHarXiv CS.CL·il y a 8j

Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology

Cette recherche étudie comment l'adaptation de domaine remodèle le comportement explicatif des modèles de langage, en utilisant la cosmologie historique comme cadre contrôlé. L'étude implique l'entraînement d'un petit modèle à partir de zéro et le réglage fin d'un modèle plus grand pour analyser le cadrage explicatif et la position cosmologique.

LLM-as-judge language models historical cosmology Domain Adaptation

RESEARCHarXiv CS.LG·il y a 15j

FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning

Cette recherche introduit FuRA (Full-Rank Adaptation), une nouvelle méthode de réglage fin efficace en paramètres qui aborde les limites des techniques existantes en incorporant un préconditionnement spectral. En reparamétrant les matrices de poids via la décomposition en valeurs singulières de rang complet et en limitant les mises à jour, FuRA surpasse le réglage fin complet non contraint tout en maintenant l'efficacité.

Optimization deep learning machine learning spectral preconditioning

DOCHugging Face Blog·il y a 22j

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Ce contenu détaille le processus de réglage fin du modèle NVIDIA Cosmos Predict 2.5. Il utilise les techniques LoRA/DoRA pour la génération de vidéos dans des applications robotiques.

NVIDIA Cosmos Predict 2.5 DoRA Robot Video Generation Fine-tuning

RESEARCHDEV.to AI·18/04/2026

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

LlamaFactory est présenté comme un framework unifié et efficace conçu pour le fine-tuning de plus de 100 modèles de langage. Il vise à optimiser et simplifier le processus d'adaptation d'une vaste gamme de LLM.

LLMs AI frameworks machine learning large language models

ARTICLEDEV.to AI·il y a 6j

hat Makes a Good SFT Sample (And Why Most Synthetic Datasets Get It Wrong)

De nombreux modèles linguistiques affinés obtiennent des performances moindres en raison de la mauvaise qualité des données synthétiques. Le problème ne vient pas de la configuration de l'entraînement, mais du manque de mécanismes pour filtrer les erreurs lors de la génération de données synthétiques.

synthetic data LLMs model training Fine-tuning

ARTICLEKDNuggets·il y a 12j

Tweaking Local Language Model Settings with Ollama

Cet article explore en profondeur le moteur de configuration d'Ollama, détaillant comment affiner les paramètres des modèles de langage locaux.

Configuration Ollama Local LLMs Fine-tuning

Tweaking Local Language Model Settings with Ollama

RESEARCHarXiv CS.AI·08/04/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

ARTICLEThe AI Epiphany (YouTube)·06/06/2024

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

Le contenu examine comment ajuster les grands modèles linguistiques (LLM) beaucoup plus rapidement. Il met en vedette Daniel Han d'Unsloth AI, qui présente une approche pour accélérer ce processus jusqu'à 30 fois.

LLMs development AI optimization Unsloth AI

Fine-tune LLMs 30x faster! With Daniel Han (Unsloth AI)

ARTICLEAnalytics Vidhya·05/05/2026

Top 10 Open-Source Libraries to Fine-Tune LLMs Locally

L'article présente les 10 meilleures bibliothèques open-source pour l'ajustement local des LLM. Ces outils simplifient considérablement le processus de fine-tuning, éliminant le besoin de construire la pile d'entraînement à partir de zéro.

Open Source LLMs local development Libraries

NEWSTogether AI Blog·18/03/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI a étendu son service de fine-tuning avec un support natif pour l'appel d'outils, le raisonnement et les modèles de vision-langage. Les améliorations comprennent également la formation de modèles de plus de 100 milliards de paramètres, un débit jusqu'à 6 fois supérieur, et des estimations de coût et de délai.

Vision-Language Models tool-calling Reasoning Together AI

NEWSTogether AI Blog·30/04/2026

Announcing Together AI and Adaption Partnership

Together AI et Adaption s'associent pour intégrer nativement Together Fine-Tuning dans Adaptive Data. Cette collaboration vise à aider les équipes à optimiser les ensembles de données, à effectuer le fine-tuning, à évaluer les résultats et à déployer des modèles ouverts plus robustes.

data optimization machine learning AI partnerships Fine-tuning