DOCAWS Machine Learning Blog·hace 6d
Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
Esta publicación explica cómo usar Supervised Fine-Tuning (SFT) y Direct Preference Optimization (DPO) para mejorar la precisión de la llamada a herramientas de un modelo de lenguaje pequeño. Demuestra cómo utilizar los trabajos de entrenamiento de Amazon SageMaker AI para centrarse en el código de entrenamiento y evaluar la calidad del modelo.
28