DOC27

Evaluating Deep Agents using LangSmith on AWS

AWS Machine Learning Blog·28 mai 2026

Cet article propose un guide pratique combinant les enseignements de LangChain et d'Anthropic pour évaluer les agents d'IA profonds. Il détaille comment appliquer des modèles d'évaluation, créer des évaluations hors ligne avec pytest et LangSmith, et configurer le monitoring en ligne à l'aide d'un agent texte-à-SQL avec Amazon Bedrock.

MLOps AWS LangSmith AI evaluation AI agents

Lire l'original ↗