SLM — artículos, noticias e investigación de IA

DOCAWS Machine Learning Blog·hace 6d

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

Esta publicación explica cómo usar Supervised Fine-Tuning (SFT) y Direct Preference Optimization (DPO) para mejorar la precisión de la llamada a herramientas de un modelo de lenguaje pequeño. Demuestra cómo utilizar los trabajos de entrenamiento de Amazon SageMaker AI para centrarse en el código de entrenamiento y evaluar la calidad del modelo.

SageMaker learning tool-calling SLM