DOC28
Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
AWS Machine Learning Blog·3 de junio de 2026
Esta publicación explica cómo usar Supervised Fine-Tuning (SFT) y Direct Preference Optimization (DPO) para mejorar la precisión de la llamada a herramientas de un modelo de lenguaje pequeño. Demuestra cómo utilizar los trabajos de entrenamiento de Amazon SageMaker AI para centrarse en el código de entrenamiento y evaluar la calidad del modelo.
Leer original ↗