DOC27

Evaluating Deep Agents using LangSmith on AWS

AWS Machine Learning Blog·28. Mai 2026

Dieser Beitrag bietet eine praktische Anleitung, die Erkenntnisse aus LangChain und Anthropic kombiniert, um tiefe KI-Agenten zu bewerten. Er beschreibt, wie Bewertungsmodelle angewendet, Offline-Bewertungen mit pytest und LangSmith erstellt und Online-Überwachung mit einem Text-zu-SQL-Agenten auf Amazon Bedrock konfiguriert werden können.

MLOps AWS LangSmith AI evaluation AI agents

Original lesen ↗