DOC28

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

AWS Machine Learning Blog·3 de junho de 2026

Este post descreve como usar Supervised Fine-Tuning (SFT) e Direct Preference Optimization (DPO) para melhorar a precisão da chamada de ferramentas de um pequeno modelo de linguagem. Ele demonstra o uso de trabalhos de treinamento do Amazon SageMaker AI para focar no código e avaliar a qualidade do modelo.

SageMaker learning tool-calling SLM fine-tuning

Ler original ↗