heapsort
DOC28

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

AWS Machine Learning Blog·3 juin 2026

Ce billet explique comment utiliser Supervised Fine-Tuning (SFT) et Direct Preference Optimization (DPO) pour améliorer la précision de l'appel d'outils d'un petit modèle de langage. Il détaille l'utilisation des tâches d'entraînement Amazon SageMaker AI pour se concentrer sur le code et évaluer la qualité du modèle.

Lire l'original