DOC28

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

AWS Machine Learning Blog·3 de junio de 2026

Esta publicación explica cómo usar Supervised Fine-Tuning (SFT) y Direct Preference Optimization (DPO) para mejorar la precisión de la llamada a herramientas de un modelo de lenguaje pequeño. Demuestra cómo utilizar los trabajos de entrenamiento de Amazon SageMaker AI para centrarse en el código de entrenamiento y evaluar la calidad del modelo.

SageMaker learning tool-calling SLM Fine-tuning

Leer original ↗