DOC28
Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
AWS Machine Learning Blog·3 de junho de 2026
Este post descreve como usar Supervised Fine-Tuning (SFT) e Direct Preference Optimization (DPO) para melhorar a precisão da chamada de ferramentas de um pequeno modelo de linguagem. Ele demonstra o uso de trabalhos de treinamento do Amazon SageMaker AI para focar no código e avaliar a qualidade do modelo.
Ler original ↗