DOC27
Evaluating Deep Agents using LangSmith on AWS
AWS Machine Learning Blog·28 mai 2026
Cet article propose un guide pratique combinant les enseignements de LangChain et d'Anthropic pour évaluer les agents d'IA profonds. Il détaille comment appliquer des modèles d'évaluation, créer des évaluations hors ligne avec pytest et LangSmith, et configurer le monitoring en ligne à l'aide d'un agent texte-à-SQL avec Amazon Bedrock.
Lire l'original ↗