← heapsort-ai

SLM

1 items

DOCAWS Machine Learning Blog·hace 6d

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

Esta publicación explica cómo usar Supervised Fine-Tuning (SFT) y Direct Preference Optimization (DPO) para mejorar la precisión de la llamada a herramientas de un modelo de lenguaje pequeño. Demuestra cómo utilizar los trabajos de entrenamiento de Amazon SageMaker AI para centrarse en el código de entrenamiento y evaluar la calidad del modelo.

28